「AIは、真っ白なキャンバスから絵を描くのではない?」
画像、動画、音楽...。私たちが目にする生成AIの驚異的なアウトプットは、実は「ノイズ」から生み出されています。 今回は、現代のAIの核となる技術「ディフュージョンモデル(拡散モデル)」の仕組みを解説します。なぜAIは「ノイズ」から犬の画像を生み出せるのか?なぜAIは高度な音楽を生成できるのに、音楽の基本中の基本である「BPM(テンポ)」が苦手なのか?
エンタメと関係が深い画像・動画・音楽生成AIの「創造プロセス」の秘密に迫る前編です。