11/23 進捗報告

今週やった事

複数のライブラリの追加
inaSpeechSegmenter : 入力した音声ファイルを無音、会話、bgmなどに区分してテキストで出力してくれる。

ffmpeg-python : 映像を音声ファイルに変換する。今回は.mp4を.wavへ変換

VOSK : 音声ファイルを自動で文字で書き上げてくれる。
githubからコードを持ってくる予定だったが、こちらを使う予定は今のところなし

来週までにやる事

変換作業は終わったので、mainプログラムと組み合わせる。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です