mirror of
https://github.com/HiMeditator/auto-caption.git
synced 2026-02-24 02:34:41 +08:00
docs(README): 更新自带字幕引擎说明 (#4)
- 在 README.md、README_en.md 和 README_ja.md 中添加了自带字幕引擎的详细说明 - 给予字幕窗口更大的顶置优先级
This commit is contained in:
43
README_ja.md
43
README_ja.md
@@ -24,7 +24,7 @@
|
||||
|
||||
[プロジェクト API ドキュメント(中国語)](./docs/api-docs/electron-ipc.md)
|
||||
|
||||
### 基本的な使用方法
|
||||
## 📖 基本的な使用方法
|
||||
|
||||
現在、Windows プラットフォーム向けのインストール可能なバージョンのみ提供されています。デフォルトの Gummy 字幕エンジンを使用する場合、まず Alibaba Cloud 百煉プラットフォームの API キーを取得し、環境変数に設定する必要があります。これによりモデルが正常に動作します。
|
||||
|
||||
@@ -49,6 +49,47 @@
|
||||
- Linux プラットフォームでは、現在マイク入力の字幕生成のみがサポートされています。
|
||||
- 現在、macOS プラットフォームには対応していません。
|
||||
|
||||
以下是你选择的内容翻译成日语的结果:
|
||||
|
||||
---
|
||||
|
||||
## ⚙️ 搭載字幕エンジンの説明
|
||||
|
||||
現在のソフトウェアには 1 つの字幕エンジンが搭載されており、新しい 2 つのエンジンが計画されています。それぞれの詳細情報は以下の通りです。
|
||||
|
||||
### Gummy 字幕エンジン(クラウド)
|
||||
|
||||
通義実験室の [Gummy音声翻訳大規模モデル](https://help.aliyun.com/zh/model-studio/gummy-speech-recognition-translation/) を基に開発され、[阿里云百煉](https://bailian.console.aliyun.com) の API 経由でこのクラウドモデルを呼び出します。
|
||||
|
||||
**モデルの詳細パラメータ:**
|
||||
|
||||
- 音声サンプリングレートのサポート:16kHz以上
|
||||
- 音声サンプル深度:16bit
|
||||
- 音声チャンネル数のサポート:シングルチャンネル
|
||||
- 識別可能な言語:中国語、英語、日本語、韓国語、ドイツ語、フランス語、ロシア語、イタリア語、スペイン語
|
||||
- サポートする翻訳:
|
||||
- 中国語 → 英語、日本語、韓国語
|
||||
- 英語 → 中国語、日本語、韓国語
|
||||
- 日本語、韓国語、ドイツ語、フランス語、ロシア語、イタリア語、スペイン語 → 中国語または英語
|
||||
|
||||
**ネットワークトラフィック消費量:**
|
||||
|
||||
字幕エンジンはネイティブサンプリングレート(48kHzと仮定)を使用してサンプリングを行い、サンプル深度は16bitであり、アップロードされる音声はシングルチャンネルであるため、アップロード速度は約:
|
||||
|
||||
$$
|
||||
48000\, \text{samples/second} \times 2\,\text{bytes/sample} \times 1\, \text{channel} = 93.75\,\text{KB/s}
|
||||
$$
|
||||
|
||||
モデルからの結果返送によるトラフィック消費は小さく、考慮する必要はありません。
|
||||
|
||||
### Vosk 字幕エンジン(ローカル)
|
||||
|
||||
[vosk-api](https://github.com/alphacep/vosk-api) をベースにした開発を予定しており、現在試験段階にあります。
|
||||
|
||||
### FunASR 字幕エンジン(ローカル)
|
||||
|
||||
可能であれば、[FunASR](https://github.com/modelscope/FunASR) をベースに開発を行う予定です。まだ調査および実現可能性の検証が行われていません。
|
||||
|
||||
## 🚀 プロジェクトの実行
|
||||
|
||||

|
||||
|
||||
Reference in New Issue
Block a user