森山さんのページ

Just another AIT MM-LAB Webs site

11/23 進捗報告

投稿日時: 2022年11月24日投稿者: x19095xx

今週やった事

複数のライブラリの追加
inaSpeechSegmenter : 入力した音声ファイルを無音、会話、bgmなどに区分してテキストで出力してくれる。

ffmpeg-python : 映像を音声ファイルに変換する。今回は.mp4を.wavへ変換

VOSK : 音声ファイルを自動で文字で書き上げてくれる。
githubからコードを持ってくる予定だったが、こちらを使う予定は今のところなし

来週までにやる事

変換作業は終わったので、mainプログラムと組み合わせる。

コメントを残すコメントをキャンセル