MENU

Fun & Interesting

初心者でもできる無料で最高の音声認識ソフトのwhisperの導入方法です#ai#音声認識#文字起こし #動画編集

AI is in wonderland 7,264 2 years ago
Video Not Working? Fix It Now

今更ですが、whisperの素晴らしさを皆様に伝えたい。 この動画を見れば、パソコンに詳しくなくても導入できます。 テンポよく話しているので、分かりにくいところは動画を止めて見てください。 一度インストールすれば、簡単に起動できるバッチファイルも作りましたので、ぜひ使ってみてください。 Hugging face openAI/ Whisperページ https://github.com/openai/whisper PyTorchのページ https://pytorch.org/ Step1. フォルダ内にvenv構築 フォルダ内で右クリック→ターミナルで開く #venv構築 python -m venv venv #venvの活性化 .\venv\Scripts\activate Step2. Powershellのポリシー変更のコマンド #スクリプト使用可能にする Set-ExecutionPolicy RemoteSigned #ポリシーの確認 Get-ExecutionPolicy #スクリプト不可にする Set-ExecutionPolicy Restricted Step3 PyTorchのインストールコマンド pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 Step4. Whisperのインストールコマンド pip install git+https://github.com/openai/whisper.git Step5 .FFmpegのインストール FFmpeg.orgのページ https://ffmpeg.org/ Windows built by Btbnのページ https://github.com/BtbN/FFmpeg-Builds/releases Step5 .Whisperの使用 まずvenvをアクティベイトして whisper --model large-v2 --language Japanese “解析したい音声、動画のパス” おまけの英訳(英語への翻訳のみです) whisper --model large-v2 --language Japanese --translate “解析したい音声、動画のパス” バッチファイルのためのVBSファイル(このファイルは自作です(動作は確認しています)) ファイル名:sendkeys.vbs #コマンド: set OBJECT=WScript.CreateObject("WScript.Shell") WScript.sleep 1000 OBJECT.SendKeys "whisper --model large-v2 --language Japanese " バッチファイル ファイル名:whisper-start.bat #コマンド: @echo off start Powershell.exe -noexit -Command "& {. .\venv\Scripts\Activate}" cscript //nologo sendkeys.vbs 00:00 はじめに 01:51 準備 03:49 VENVの構築 04:29 PyTorchのインストール 05:14 Whisperのインストール 05:50 FFmpegのインストール 07:23 Whisperの使用方法 09:49 Vrewとの比較 12:27 MediumとLarge V2の比較 14:02 バッチファイルの作成

Comment