flavioy
|
6c61ddc6b0
|
性能优化:帧采样、FFmpeg编码、帧预读取、消除冗余拷贝
- 字幕检测:每3帧采样一次OCR,中间帧插值填充,检测速度提升约3倍
- 视频编码:cv2.VideoWriter(mp4v) 替换为 FFmpeg libx264 管道编码,画质更好、体积更小
- 帧预读取:后台线程预解码视频帧,I/O 与模型推理重叠
- 消除 deepcopy:numpy 数组改用 .copy() 替代 copy.deepcopy,降低内存开销
- 清理冗余颜色空间转换中的 np.array() 包装
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
|
2026-04-07 22:58:52 +08:00 |
|
flavioy
|
70e669e9d4
|
升级 PaddleOCR 至 3.4.0,移除 PP-OCRv4 模型
- PaddleOCR 2.10.0 升级至 3.4.0,使用新的 TextDetection API 替代旧版 TextDetector
- V5 模型替换为 PaddleX 格式(inference.pdiparams + inference.yml)
- 移除 PP-OCRv4 模型(backend/models/V4),仅保留 PP-OCRv5
- 字幕检测选项重命名为"快速"和"精准"
- 清理 requirements.txt,移除 11 个未使用的依赖,补充缺失的依赖
- 更新设计素材
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
|
2026-04-07 22:34:36 +08:00 |
|
Jason
|
e26e23ad6a
|
支持设置时间选区
支持方向键快进快退(ctrl + -> or shirft + -> or ->)
|
2025-05-22 15:09:59 +08:00 |
|
Jason
|
7cf4e882cd
|
初步支持 macOS (Apple Silicon)
升级至PP-OCRv5
Tested with Python 3.13
感谢用户 "期望" 提供的macOS设备用于开发测试
|
2025-05-22 13:02:28 +08:00 |
|
Jason
|
c673b5ccd1
|
支持多字幕区域
|
2025-05-22 08:42:00 +08:00 |
|
Jason
|
f78e985e1c
|
使用PySide6-Fluent-Widgets重构整套UI
添加任务列表组件并优化视频加载逻辑
支持可视化显示字幕区域
整理所有模型, 分别为STTN智能擦除, STTN字幕检测, LAMA, ProPainter, OpenCV
提高处理性能
新增CPU运行模式并优化多语言支持
修复Propainter模式部分视频报错
本次提交新增了CPU运行模式,适用于无GPU加速的场景。同时,优化了多语言支持,新增了日语、韩语、越南语等语言配置文件,并更新了README文档以反映新的运行模式和多语言支持。此外,修复了部分代码逻辑,提升了系统的稳定性和兼容性。
|
2025-05-22 08:41:59 +08:00 |
|