今更ですが、whisperの素晴らしさを皆様に伝えたい。
この動画を見れば、パソコンに詳しくなくても導入できます。
テンポよく話しているので、分かりにくいところは動画を止めて見てください。
一度インストールすれば、簡単に起動できるバッチファイルも作りましたので、ぜひ使ってみてください。
Hugging face openAI/ Whisperページ
https://github.com/openai/whisper
PyTorchのページ
https://pytorch.org/
Step1. フォルダ内にvenv構築
フォルダ内で右クリック→ターミナルで開く
#venv構築
python -m venv venv
#venvの活性化
.\venv\Scripts\activate
Step2. Powershellのポリシー変更のコマンド
#スクリプト使用可能にする
Set-ExecutionPolicy RemoteSigned
#ポリシーの確認
Get-ExecutionPolicy
#スクリプト不可にする
Set-ExecutionPolicy Restricted
Step3 PyTorchのインストールコマンド
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
Step4. Whisperのインストールコマンド
pip install git+https://github.com/openai/whisper.git
Step5 .FFmpegのインストール
FFmpeg.orgのページ
https://ffmpeg.org/
Windows built by Btbnのページ
https://github.com/BtbN/FFmpeg-Builds/releases
Step5 .Whisperの使用
まずvenvをアクティベイトして
whisper --model large-v2 --language Japanese “解析したい音声、動画のパス”
おまけの英訳(英語への翻訳のみです)
whisper --model large-v2 --language Japanese --translate “解析したい音声、動画のパス”
バッチファイルのためのVBSファイル(このファイルは自作です(動作は確認しています))
ファイル名:sendkeys.vbs
#コマンド:
set OBJECT=WScript.CreateObject("WScript.Shell")
WScript.sleep 1000
OBJECT.SendKeys "whisper --model large-v2 --language Japanese "
バッチファイル
ファイル名:whisper-start.bat
#コマンド:
@echo off
start Powershell.exe -noexit -Command "& {. .\venv\Scripts\Activate}"
cscript //nologo sendkeys.vbs
00:00 はじめに
01:51 準備
03:49 VENVの構築
04:29 PyTorchのインストール
05:14 Whisperのインストール
05:50 FFmpegのインストール
07:23 Whisperの使用方法
09:49 Vrewとの比較
12:27 MediumとLarge V2の比較
14:02 バッチファイルの作成