Files
auto-caption/README_ja.md
himeditator 213426dace release v0.2.0
- 更新和增加文档
- 添加新的图片
- 优化文档结构和内容
2025-07-07 22:54:30 +08:00

4.3 KiB
Raw Blame History

auto-caption

Auto Caption はクロスプラットフォームのリアルタイム字幕表示ソフトウェアです。

| 簡体中文 | 英語 | 日本語 |

v0.2.0 バージョンがリリースされました。ローカル字幕エンジンを追加予定の v1.0.0 バージョンが開発中...

📥 ダウンロード

GitHub Releases

📚 関連ドキュメント

Auto Caption ユーザーマニュアル

字幕エンジン説明文書

プロジェクト API ドキュメント(中国語)

基本的な使用方法

現在、Windows プラットフォーム向けのインストール可能なバージョンのみ提供されています。デフォルトの Gummy 字幕エンジンを使用する場合、まず Alibaba Cloud 百煉プラットフォームの API キーを取得し、環境変数に設定する必要があります。これによりモデルが正常に動作します。

アリババクラウドの国際版には Gummy モデルが提供されていないため、中国以外のユーザーは現在、デフォルトの字幕エンジンを使用できません。すべてのユーザーが利用できるように、新しいローカルの字幕エンジンを開発中です。

関連チュートリアル:

字幕エンジンの仕組みを理解したい場合、または独自の字幕エンジンを開発したい場合は、字幕エンジン説明文書を参照してください。

特徴

  • 複数言語のインターフェースサポート
  • 豊富な字幕スタイル設定
  • 柔軟な字幕エンジン選択
  • 複数言語の認識と翻訳
  • 字幕記録の表示とエクスポート
  • オーディオ出力とマイク入力の字幕生成

注意事項:

  • Windows プラットフォームでは、オーディオ出力とマイク入力の両方の字幕生成がサポートされています。
  • Linux プラットフォームでは、現在マイク入力の字幕生成のみがサポートされています。
  • 現在、macOS プラットフォームには対応していません。

🚀 プロジェクトの実行

依存関係のインストール

npm install

字幕エンジンのビルド

まず、caption-engine フォルダに移動し、以下のコマンドを実行して仮想環境を作成します:

python -m venv subenv

次に、仮想環境をアクティブ化します:

# Windows
subenv/Scripts/activate
# Linux
source subenv/bin/activate

次に、依存関係をインストールしますLinux 環境の場合、requirements.txtPyAudioWPatch をコメントアウトする必要があります。このモジュールは Windows 環境でのみ適用されます):

pip install -r requirements.txt

次に、pyinstaller を使用してプロジェクトをビルドします:

pyinstaller --onefile main-gummy.py

この時点でプロジェクトのビルドが完了し、caption-engine/dist フォルダで対応する実行ファイルを見つけることができます。その後、必要な操作を行ってください。

プロジェクトの実行

npm run dev

プロジェクトのビルド

現在、ソフトウェアは macOS プラットフォームに対応していません。Windows または Linux システムを使用してビルドしてください。完全な機能を備えた Windows プラットフォームが推奨されます。

# For Windows
npm run build:win
# For macOS, not avaliable yet
npm run build:mac
# For Linux
npm run build:linux