Files
auto-caption/docs/CHANGELOG.md
2025-09-08 15:19:10 +08:00

4.5 KiB
Raw Blame History

v0.0.1

2025-06-22

发布第一版软件。

v0.1.0

2025-06-26

新增功能

  • 添加错误通知
  • 添加默认引擎的环境变量检查
  • 添加配置数据文件保存和载入
  • 添加字幕样式恢复默认的选项
  • 添加项目关于信息

新增文档

  • 添加用户说明文档
  • 添加字幕引擎说明文档

v0.2.0

2025-07-05

对项目进行了重构,修复了 bug添加了新功能。本版本为正式版。

新增功能

  • 添加长字幕内容隐藏功能 (#1)
  • 添加多界面语言支持(中文、英语、日语)
  • 添加暗色主题

提升体验

  • 优化界面布局
  • 添加更多可保存和载入的配置项
  • 为字幕引擎添加更严格的状态限制,防止出现僵尸进程

修复bug

  • 添加字幕引擎长时间空置后报错的问题 (#2)

新增文档

  • 新增日语说明文档
  • 新增英语、日语字幕引擎说明文档和用户手册
  • 新增 electron ipc api 文档

v0.3.0

2025-07-09

对字幕引擎代码进行了重构,软件适配了 macOS 平台,添加了新功能。

新增功能

  • 添加软件内设置 API KEY 的功能
  • 添加字幕字体粗细和文本阴影的设置
  • 添加复制字幕记录到剪贴板的功能 (#3)

优化体验

  • 字幕时间记录精确到毫秒
  • 更详细的说明文档(添加字幕引擎规格说明、用户文档和字幕引擎文档更新) (#4)
  • 适配 macOS 平台
  • 字幕窗口有了更大的顶置优先级
  • 预览窗口可以实时显示最新的字幕内容

修复bug

  • 修复使用系统主题时暗色系统载入为亮色的问题

v0.4.0

2025-07-11

添加了 Vosk 本地字幕引擎,更新了项目文档,继续优化使用体验。

新增功能

  • 添加了基于 Vosk 的字幕引擎, 当前 Vosk 字幕引擎暂不支持翻译
  • 更新用户界面,增加 Vosk 引擎选项和模型路径设置

优化体验

  • 字幕窗口右上角图标的颜色改为和字幕原文字体颜色一致

v0.5.0

2025-07-15

为软件本体添加了更多功能、适配了 Linux。

新增功能

  • 适配了 Linux 平台
  • 新增修改字幕时间功能,可调整字幕时间
  • 支持导出 srt 格式的字幕记录
  • 支持显示字幕引擎状态pid、ppid、CPU占用率、内存占用、运行时间

优化体验

  • 调整字幕窗口右上角图标为竖向排布
  • 过滤 Gummy 字幕引擎输出的不完整字幕

v0.5.1

2025-07-17

修复 bug

  • 修复无法调用自定义字幕引擎的 bug
  • 修复自定义字幕引擎的参数失效 bug

v0.6.0

2025-07-29

新增功能

  • 新增字幕记录排序功能,可选择字幕记录正序或倒叙显示

优化体验

  • 减小了软件安装包的体积
  • 微调字幕引擎设置界面布局
  • 交换窗口界面信息弹窗和错误弹窗的位置,防止提示信息挡住操作
  • 提高程序健壮性,完全避免字幕引擎进程成为孤儿进程
  • 修改字幕引擎文档,添加更详细的开发说明

项目优化

  • 重构字幕引擎,提示字幕引擎代码的可扩展性和可读性
  • 合并 Gummy 和 Vosk 引擎为单个可执行文件
  • 字幕引擎和主程序添加 Socket 通信,完全避免字幕引擎成为孤儿进程

v0.7.0

2025-08-20

新增功能

  • 添加字幕窗口宽度记忆,重新打开时与上次字幕窗口宽度一致
  • 在尝试关闭字幕引擎 4s 后字幕引擎仍未关闭,则强制关闭字幕引擎
  • 添加复制最新字幕选项用户可以选择只复制最近1~3条字幕 (#13)
  • 添加主题颜色设置,支持六种颜色:蓝色、绿色、橙色、紫色、粉色、暗色/明色
  • 添加日志记录显示:可以查看软件的字幕引擎输出的日志记录

优化体验

  • 优化软件用户界面的部分组件
  • 更清晰的日志输出

v1.0.0

2025-09-08

新增功能

  • 字幕引擎添加超时关闭功能:如果在规定时间字幕引擎没有启动成功会自动关闭;在字幕引擎启动过程中可选择关闭字幕引擎
  • 添加非实时翻译功能:支持调用 Ollama 本地模型进行翻译;支持调用 Google 翻译 API 进行翻译
  • 添加新的翻译模型:添加 SOSV 模型,支持识别英语、中文、日语、韩语、粤语
  • 添加录音功能:可以将字幕引擎识别的音频保存为 .wav 文件
  • 添加多行字幕功能,用户可以设置字幕窗口显示的字幕的行数

优化体验

  • 优化部分提示信息显示位置
  • 替换重采样模型,提高音频重采样质量
  • 带有额外信息的标签颜色改为与主题色一致