たまたま著者登壇のYouTubeを見たのがきっかけで、面白そうだったので、『AITuberを作ってみたら生成AIプログラミングがよくわかった件』を買ってみました。
なお、著者のGitHubリポジトリはありますが、openai==0.28.1 なので、openai==1.30.5 版を作りました(他軽微な修正あり)。
処理の大まかな流れとしては、以下のようになっています。
- YouTubeからコメントを取得する
- AIキャラクターの返答を生成する(OpenAIのAPI)
- 返答の文字列から音声を生成する(VOICEVOX)
- 配信ソフトに返答を送信して出力する(OBS Studio)
VOICEVOX は無料のテキスト読み上げ合成音声ソフトです。個人的にはずんだもんをよく目(耳)にする気がします。VOICEVOX から OBS Studio に音声を送るために、仮想マイク VB-CABLE を使います。
YouTubeからのコメント取得、VOICEVOX や OBS Studio との連携は Python でできるので(OpenAIのAPIは言わずもがな)、めっちゃ簡単にAITuberになれました。
テスト配信はこちら。
テキスト生成部分を作りこむだけでも、いろいろできそう。
コメント