nocmt
|
0825e48902
|
feat(engine): 添加GLM-ASR语音识别引擎支持
- 新增GLM-ASR云端语音识别引擎实现
- 扩展配置界面添加GLM相关参数设置
- Ollama支持自定义域名和Apikey以支持云端和其他LLM
- 修改音频处理逻辑以支持新引擎
- 更新依赖项和构建配置
- 修复Ollama翻译功能相关问题
|
2026-01-10 16:02:24 +08:00 |
|
himeditator
|
e6a65f8362
|
feat(engine): 字幕引擎添加在终端直接显示字幕的功能
|
2025-11-01 21:06:28 +08:00 |
|
himeditator
|
4494b2c68b
|
feat(renderer):实现多行字幕显示功能
- 在 CaptionStyle 组件中添加字幕行数设置选项
- 修改组件以支持多行字幕显示
- 优化字幕数据处理逻辑,支持按时间顺序显示多条字幕
|
2025-09-07 21:06:11 +08:00 |
|
himeditator
|
4abd6d0808
|
feat(renderer): 在用户界面中添加新功能的设置
- 添加录音功能,可保存为 WAV 文件
- 优化字幕引擎设置界面,支持更多配置选项
- 更新多语言翻译,增加模型下载链接等信息
|
2025-09-07 14:35:18 +08:00 |
|
himeditator
|
6bff978b88
|
feat(engine): 替换重采样模型、SOSV 添加标点恢复模型
- 将 samplerate 库替换为 resampy 库,提高重采样质量
- Shepra-ONNX SenseVoice 添加中文和英语标点恢复模型
|
2025-09-06 23:15:33 +08:00 |
|
himeditator
|
eba2c5ca45
|
feat(engine): 重构字幕引擎,新增 Sherpa-ONNX SenseVoice 语音识别模型
- 重构字幕引擎,将音频采集改为在新线程上进行
- 重构 audio2text 中的类,调整运行逻辑
- 更新 main 函数,添加对 Sosv 模型的支持
- 修改 AudioStream 类,默认使用 16000Hz 采样率
|
2025-09-06 20:49:46 +08:00 |
|
himeditator
|
2b7ce06f04
|
feat(translation): 添加非实时翻译功能用户界面组件
|
2025-09-04 23:41:22 +08:00 |
|
himeditator
|
14987cbfc5
|
feat(vosk): 为 Vosk 模型添加非实时翻译功能 (#14)
- 添加 Ollama 大模型翻译和 Google 翻译(非实时),支持多种语言
- 为 Vosk 引擎添加非实时翻译
- 为新增的翻译功能添加和修改接口
- 修改 Electron 构建配置,之后不同平台构建无需修改构建文件
|
2025-09-02 23:19:53 +08:00 |
|
himeditator
|
34362fea3d
|
feat(auto-caption): 发布 v0.7.0 版本
|
2025-08-20 00:53:06 +08:00 |
|
himeditator
|
771f7ad002
|
feat(log): 添加软件日志功能
- 新增 SoftwareLog 相关接口和数据结构
- 实现日志数据的收集和展示
- 添加日志相关的国际化支持
- 优化控制页面布局,支持日志切换显示
|
2025-08-19 22:23:54 +08:00 |
|
himeditator
|
1c0bf1f9c4
|
refactor(engine): 修改虚拟环境设置,修改音频工具函数
- 更新虚拟环境目录名为 .venv
- 调整音频块采集速率默认值为 10
- 为 AudioStream 类添加重设音频块大小的方法
- 更新依赖文件 requirements.txt
|
2025-08-03 16:40:26 +08:00 |
|
himeditator
|
38b4b15cec
|
feat(engine): 添加字幕窗口宽度记忆功能并优化字幕引擎关闭逻辑
- 添加 captionWindowWidth 属性,用于保存字幕窗口宽度
- 修改 CaptionEngine 中的 stop 和 kill 方法,优化字幕引擎关闭逻辑
- 更新 README,添加预备模型列表
|
2025-08-02 15:57:07 +08:00 |
|
himeditator
|
1b7ff33656
|
feat(docs): 更新项目文档和图片
|
2025-07-29 23:20:15 +08:00 |
|
himeditator mac
|
d5d692188e
|
feat(engine): 优化字幕引擎、提升程序健壮性
- 优化服务器启动流程,增加异常处理
- 主程序和字幕引擎的 WebSocket 端口号改为随机生成
|
2025-07-29 19:37:03 +08:00 |
|
himeditator
|
e4f937e6b6
|
feat(engine): 优化字幕引擎通信和控制逻辑,优化窗口信息展示
- 优化错误处理和引擎重启逻辑
- 添加字幕引擎强制终止功能
- 调整通知和错误提示的显示位置
- 优化日志记录精度到毫秒级
|
2025-07-28 21:44:49 +08:00 |
|
himeditator
|
cd9f3a847d
|
feat(engine): 重构字幕引擎并实现 WebSocket 通信
- 重构了 Gummy 和 Vosk 字幕引擎的代码,提高了可扩展性和可读性
- 合并 Gummy 和 Vosk 引擎为单个可执行文件
- 实现了字幕引擎和主程序之间的 WebSocket 通信,避免了孤儿进程问题
|
2025-07-28 15:49:52 +08:00 |
|
himeditator
|
b658ef5440
|
feat(engine): 优化字幕引擎输出格式、准备合并两个字幕引擎
- 重构字幕引擎相关代码
- 准备合并两个字幕引擎
|
2025-07-27 17:15:12 +08:00 |
|