
半日でできた自動生成ニュースを配信するチャンネル
https://www.youtube.com/channel/UCxnAopAdwx_7OCFCH7ko54w/
例のアルバム
https://distrokid.com/hyperfollow/tadanobu/synchronicity
https://music.youtube.com/playlist?list=PLFq2lXrIB0rGRcVso1gCfmXx2B8Yo4EE_&si=2b17wQsbyB0aPiLL
気温は0度前後、体感的にはもっと寒く感じる冬の朝。いつものように白い息を吐きながらのウォーキング収録です。
冒頭では、この季節の健康管理に欠かせない「鼻うがい」について。毎朝晩の習慣にすることで、風邪やインフルエンザが流行る時期でも体調を崩さずに済んでいるという実体験をシェアしています。また、前回の配信で話題にした「iZotope RX」による音声のノイズ処理についても触れています。前回はノイズを除去しすぎて「その場の空気感」まで消えてしまったという反省から、今回はあえて環境音(足音や風の音)を残す設定に変更。iZotopeのバッチ処理設定を見直し、聴きやすさと臨場感のバランスを探った、オーディオファイルとしての「音」へのこだわりについて語ります。
そして今回のメインテーマは、週末に没頭したという「AIを活用した自分専用ニュースポッドキャストの自動生成システム開発」についてです。
これまで、朝の情報収集には本やニュースサイトを使っていましたが、「毎朝、自分の興味のあるトピックだけをまとめた音声ニュースがあったら最高なのに」という思いつきからプロジェクトがスタートしました。驚くべきは、投稿者さんが「プログラミングのコードは一切書けない」という点です。しかし、最新のAIツールを駆使することで、半日足らずでシステムをほぼ完成させてしまいました。
その具体的なワークフローは、まさに「AI時代の開発スタイル」を象徴するものです。
まず、リサーチAIの「Perplexity」を活用。最近実装された「Tasks」機能を使い、指定した時間に特定のキーワードでニュースを検索し、要約させます。
次に、その要約テキストをGoogleのAI「Gemini」に渡し、ポッドキャスト風の台本に書き換えてもらいます。ここでGeminiの人間味あふれる対応力が光ります。「ラジオ番組風に」「二人の掛け合いで」といったオーダーに対し、Geminiは「それならこういう構成はどうですか?」「もっと面白くできますよ」と、まるで優秀な放送作家のように提案を返してくれます。
台本ができたら、次は音声化と動画化です。ここでの開発には、話題のエディタ「Windsurf」を使用しました。Windsurfは「Vibe Coding(バイブコーディング)」とも呼ばれる、自然言語(普段の言葉)で指示を出すだけでコードを生成・修正してくれるツールです。
「Geminiで作成した台本を、音声合成ソフト(今回はずんだもんと四国めたんを使用)で読み上げさせ、背景画像とBGMをつけて、YouTube用の動画ファイルとして書き出す」
この複雑な処理を行うPythonコードを、Geminiにプロンプトを書いてもらい、それをWindsurfに貼り付けるだけで生成。エラーが出ても、そのエラーメッセージをまたAIに投げれば修正案が返ってくる。まさに「AIと会話しているだけでアプリができていく」という体験です。
もちろん、すんなりといかない場面もありました。特に動画変換ツールの「FFmpeg」をコマンドライン(黒い画面)で操作する部分は、本来なら高度な知識が必要です。字幕のタイミングがズレたり、キャラクターごとの色分けがうまくいかなかったりとトラブルも続出。しかし、ここでもGeminiが「色分けしましょうか?」「背景音楽と音声のバランス調整もできますよ」と、頼んでもいないのに(笑)先回りして提案してくれるなど、AIのサポートにより乗り越えることができました。
結果として、朝起きたらその日のニュースがまとまった動画が完成しており、あとはYouTubeにアップするだけ、という夢のようなシステムが(ほぼ)完成しました。
「プログラミング知識ゼロでも、やりたいという熱量とAIがあれば形にできる」
このエピソードは、テクノロジーがいかに個人のクリエイティビティを解放するかを示す、最高の実践記録となっています。AIに興味があるけれど何から始めればいいかわからない、という方にとって、背中を押される内容になること間違いありません。
チャプター
参考リンク