auto-caption

mirror of https://github.com/HiMeditator/auto-caption.git synced 2026-04-08 13:19:39 +08:00

Author	SHA1	Message	Date
himeditator	3324b630d1	feat(app): 适配最新版本 - 修改软件内部分提示文本 - 添加 API KEY 掩码，防止直接输出 API KEY 内容	2026-01-10 20:15:32 +08:00
nocmt	0825e48902	feat(engine): 添加GLM-ASR语音识别引擎支持 - 新增GLM-ASR云端语音识别引擎实现 - 扩展配置界面添加GLM相关参数设置 - Ollama支持自定义域名和Apikey以支持云端和其他LLM - 修改音频处理逻辑以支持新引擎 - 更新依赖项和构建配置 - 修复Ollama翻译功能相关问题	2026-01-10 16:02:24 +08:00
himeditator	383e582a2d	docs(readme): 更新说明并添加终端使用指南	2025-11-02 20:53:56 +08:00
himeditator	e6a65f8362	feat(engine): 字幕引擎添加在终端直接显示字幕的功能	2025-11-01 21:06:28 +08:00
himeditator	4494b2c68b	feat(renderer):实现多行字幕显示功能 - 在 CaptionStyle 组件中添加字幕行数设置选项 - 修改组件以支持多行字幕显示 - 优化字幕数据处理逻辑，支持按时间顺序显示多条字幕	2025-09-07 21:06:11 +08:00
himeditator	4abd6d0808	feat(renderer): 在用户界面中添加新功能的设置 - 添加录音功能，可保存为 WAV 文件 - 优化字幕引擎设置界面，支持更多配置选项 - 更新多语言翻译，增加模型下载链接等信息	2025-09-07 14:35:18 +08:00
himeditator	6bff978b88	feat(engine): 替换重采样模型、SOSV 添加标点恢复模型 - 将 samplerate 库替换为 resampy 库，提高重采样质量 - Shepra-ONNX SenseVoice 添加中文和英语标点恢复模型	2025-09-06 23:15:33 +08:00
himeditator	eba2c5ca45	feat(engine): 重构字幕引擎，新增 Sherpa-ONNX SenseVoice 语音识别模型 - 重构字幕引擎，将音频采集改为在新线程上进行 - 重构 audio2text 中的类，调整运行逻辑 - 更新 main 函数，添加对 Sosv 模型的支持 - 修改 AudioStream 类，默认使用 16000Hz 采样率	2025-09-06 20:49:46 +08:00
himeditator	2b7ce06f04	feat(translation): 添加非实时翻译功能用户界面组件	2025-09-04 23:41:22 +08:00
himeditator	14987cbfc5	feat(vosk): 为 Vosk 模型添加非实时翻译功能 (#14 ) - 添加 Ollama 大模型翻译和 Google 翻译（非实时），支持多种语言 - 为 Vosk 引擎添加非实时翻译 - 为新增的翻译功能添加和修改接口 - 修改 Electron 构建配置，之后不同平台构建无需修改构建文件	2025-09-02 23:19:53 +08:00
himeditator	2352bcee5d	feat(engine): 优化超时启动功能的小问题 - 更新接口文档 - 修改国际化文本使得内容不超过标签长度 - 解决强制关闭按钮点击无效的问题	2025-08-28 12:22:19 +08:00
himeditator	34362fea3d	feat(auto-caption): 发布 v0.7.0 版本	2025-08-20 00:53:06 +08:00
himeditator	771f7ad002	feat(log): 添加软件日志功能 - 新增 SoftwareLog 相关接口和数据结构 - 实现日志数据的收集和展示 - 添加日志相关的国际化支持 - 优化控制页面布局，支持日志切换显示	2025-08-19 22:23:54 +08:00
himeditator	01936d5f12	feat(renderer): 添加界面主题颜色功能，添加复制最新字幕选项(#13 ) - 新增界面主题颜色功能，支持自定义主题颜色 - 使用 antd 滑块替代原生 input 元素 - 添加复制字幕记录功能，可选择复制最近的字幕记录	2025-08-18 16:03:46 +08:00
himeditator	1c0bf1f9c4	refactor(engine): 修改虚拟环境设置，修改音频工具函数 - 更新虚拟环境目录名为 .venv - 调整音频块采集速率默认值为 10 - 为 AudioStream 类添加重设音频块大小的方法 - 更新依赖文件 requirements.txt	2025-08-03 16:40:26 +08:00
himeditator	38b4b15cec	feat(engine): 添加字幕窗口宽度记忆功能并优化字幕引擎关闭逻辑 - 添加 captionWindowWidth 属性，用于保存字幕窗口宽度 - 修改 CaptionEngine 中的 stop 和 kill 方法，优化字幕引擎关闭逻辑 - 更新 README，添加预备模型列表	2025-08-02 15:57:07 +08:00
himeditator mac	a7a60da260	fix(engine): 字幕引擎启动路径适配、音频重采样函数适配	2025-07-30 00:16:54 +08:00
himeditator	1b7ff33656	feat(docs): 更新项目文档和图片	2025-07-29 23:20:15 +08:00
himeditator mac	d5d692188e	feat(engine): 优化字幕引擎、提升程序健壮性 - 优化服务器启动流程，增加异常处理 - 主程序和字幕引擎的 WebSocket 端口号改为随机生成	2025-07-29 19:37:03 +08:00
himeditator	e4f937e6b6	feat(engine): 优化字幕引擎通信和控制逻辑，优化窗口信息展示 - 优化错误处理和引擎重启逻辑 - 添加字幕引擎强制终止功能 - 调整通知和错误提示的显示位置 - 优化日志记录精度到毫秒级	2025-07-28 21:44:49 +08:00
himeditator	cd9f3a847d	feat(engine): 重构字幕引擎并实现 WebSocket 通信 - 重构了 Gummy 和 Vosk 字幕引擎的代码，提高了可扩展性和可读性 - 合并 Gummy 和 Vosk 引擎为单个可执行文件 - 实现了字幕引擎和主程序之间的 WebSocket 通信，避免了孤儿进程问题	2025-07-28 15:49:52 +08:00
himeditator	b658ef5440	feat(engine): 优化字幕引擎输出格式、准备合并两个字幕引擎 - 重构字幕引擎相关代码 - 准备合并两个字幕引擎	2025-07-27 17:15:12 +08:00
himeditator	3792eb88b6	refactor(engine): 重构字幕引擎 - 更新 GummyTranslator 类，优化字幕生成逻辑 - 移除 audioprcs 模块，音频处理功能转移到 utils 模块 - 重构 sysaudio 模块，提高音频流管理的灵活性和稳定性 - 修改 TODO.md，完成按时间降序排列字幕记录的功能 - 更新文档，说明因资源限制将不再维护英文和日文文档	2025-07-26 23:37:24 +08:00
himeditator	8e575a9ba3	refactor(engine): 字幕引擎文件夹重命名，字幕记录添加降序选择 - 字幕记录表格可以按时间降序排列 - 将 caption-engine 重命名为 engine - 更新了相关文件和文件夹的路径 - 修改了 README 和 TODO 文档中的相关内容 - 更新了 Electron 构建配置	2025-07-26 21:29:16 +08:00

24 Commits