ポッドキャスト第35回目の紹介
- 新しいAIモデル「GPT-4 Omni」が登場し、その進化や機能について話題になっている。
- GPT-4 Omniは速く、安価であり、テキスト以外のマルチメディア処理も優れている。
- GPT-4 Omniの音声機能やリアルタイム性についても注目されている。
- Google I/Oイベントでは、AI技術の進化や新しい動画作成AIについての発表があった。
- 日本のスーパーコンピューター「不学」を使ったAIモデルの公開や、IBMのLLMモデルのオープンソース化など、さまざまなニュースがあった。
- 画像生成技術の進化により、よりリアルなAI画像が生成される可能性がある。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-43
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第34回目の紹介 1. メタ社が新しいモデル「Lemma」を発表。 2. 経済産業省がCSAIクラウドプログラム認定を発表し、桜インターネットやKDDIが補正金を受けることができた。 ## AI関連の新しいガイドライン - AIに関する規制と責任についての議論が行われている。 - オープンAIが児童に関する取り扱いについて参加している。 - 総務省や経産省がAI事業者と一般の事業者に対してガイドラインを公開している。 ## スラックのAI - スラックのAIが登場し、要約やまとめ、質問などができるようになった。 - 導入には月額1200円の追加料金がかかる。 ## 新しいAIモデル - Appleから「OpenELM」、マイクロソフトから「ファイ」の新しいモデルが登場。 - 軽量でスマホなどのデバイスでも動かせるようになっている。 ## 画像関連のAI - アドビの新しいAIモデル「ファイアフライイメージ3」が登場し、画質の向上と便利な機能が追加された。 - 他にもStable DiffusionやAtlasなど、画像生成や文字認識に関するAIが進化している。 ## JATプロジェクト - JATプロジェクトによって、さまざまな指示に対して適切な反応を返すAIが開発された。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-40
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第33回目の紹介
- オープンAIが東京にアジア初のオフィスを設立し、新しいモデルを発表
- メタ社がLyama2の後継であるLyama3をリリース
- GoogleフォトがAIによる画像編集機能を一般公開
- アドビがビデオの生成モデルに新機能を追加
- AIによる動画編集が注目される
- AIによる文字起こしツールやサービスが登場
- AIの使い道やAGIへの挑戦に関する記事が取り上げられる
- AIを実際の製品に取り入れた取り組みが紹介される
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-39
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第32回目の紹介
## オープンAIに関するニュース- オープンAIがAPIとしてJAT GPTを提供していることが注目されています。
- オープンAIのエンジニアリングチームが独自のモデルを作るプログラムを拡大しています。
- オープンAIの提供するJAT GPTを自社に合わせて調整する機能が改善されました。
- ファインチューニングの進捗状況や結果を確認するためのダッシュボードが使いやすくなりました。
- オープンAIのAPIを利用してファインチューニングを行うプログラムのサポートが拡充されました。## GPT-4 Turbo with VisionのAPI提供開始- OpenAIが提供するGPT-4 Turbo with VisionのAPIが開始されました。
- これにより、画像の読み込みとチャットを一つのモデルで行うことができるようになりました。
- APIの利便性が向上し、画像とテキストを組み合わせた質問などが簡単に行えるようになりました。## GoogleのAIモデルのアップデート- Googleが提供しているAIモデルのプロバージョンがアップデートされました。
- 一般ユーザーも利用できるようになり、開発者向けの機能も追加されました。
- JSONモードやファイルの扱いやすさなど、開発者向けの機能が充実しています。## 新しい言語モデルの登場- AIのスタートアップであるコフィアが新しい言語モデル「コマンドRプラス」を発表しました。
- 非商用利用のみですが、性能が高く、手元で利用できるモデルとして注目されています。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-38
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第31回目の紹介
## ChatGPTのサインアップ不要化
- オープンAIのChatGPTがサインアップ不要で利用可能になった
- よりアクセスしやすくなった## 音声合成AIの発表
- オープンAIから音声合成AIの発表があった
- 15秒程度のサンプルを渡すと、その声を模したクローンを作成できる
- 一般公開はされていないが、精度が高いと話題になっている## AIによる長時間音楽作成ツールの登場
- AIによって3分程度の長時間音楽が作成できるツールが登場
- 高音質でクオリティが高いと評判## 著作権侵害の防止技術の搭載
- AIの音楽生成において著作権侵害の防止技術が搭載されている
- アーティストの懸念もあるが、共存できる方法を模索している## 新しいAIモデルの登場
- DBiとJambaという新しいAIモデルが登場
- Jambaは従来のアーキテクチャーとは異なるハイブリッドモデルを採用
- メモリの消費が少なく、高速で品質も良いと評価されている
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-37
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第30回目の紹介 - クロードさんが作成した音声が話題になっています。クロードはAWSと提携しており、最新のモデルが注目されています。また、GeminiというAIも注目されています。- AIのモデルによって、色々な特徴があります。GPTは簡潔な文章を生成し、Googleはパッションを感じさせる文章を生成します。Geminiは真面目な印象を与えます。- AIのモデルの使い分けについても話し合われています。クロードは長文の執筆に適しているとされています。- AIのモデルが進化していることが話題になっています。クロードのモデルは専門性が高く、AWSとの提携によりさらなる進化が期待されています。- オープンAIがソラーという動画生成モデルを発表し、動画の生成技術も進化していることが話題になっています。- AIの利用方法には注意が必要であり、クオリティの高い出力ができる一方で、中身が不十分なものも存在することが指摘されています。- AIの利用による社会への影響にも注意が必要であり、バイアスや政治的な影響がある場合には慎重に対応する必要があります。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-36
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第29回目の紹介
- NVIDIAが新しいGPU「Blackwell」を発表し、AIの推論性能が向上したことが話題となっている。
- AppleのiPhoneにGoogleが作ったGeminiを搭載する可能性があるとの噂が広まっている。
- 魚AIが新しい大規模言語モデルの開発方法を提唱し、注目を集めている。
- GoogleがYouTubeでAIを使用してコンテンツを作成し、AIの使用が明示されるようになっている。
- SAKANA AIがオープンソース化され、注目を集めている。
- 生成AIを主としたスタートアップ企業がKDDIの子会社化になり、資本力を得て成長が期待されている。
- スタビリティAIが高精度な3Dモデルの動画生成技術を開発し、話題となっている。
- 自然言語でゲームの操作をすることができるAIエージェント「SIMA」が開発され、注目を集めている。
- 「Devyn」というソフトウェアが開発され、ソフトウェアの開発をサポートするエージェントとして注目を集めている。
- AIの最適な情報を得るための手法やファインチューニングに関する検証記事が複数取り上げられている。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-35
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第28回目の紹介
## トピック1: イーロン・マスクさんとオープンAIの訴訟
- イーロン・マスクさんがオープンAIに対して訴えを起こしたことが話題になっている。
- イーロン・マスクさんの発言内容やオープンAIの反応については後で触れる予定。## トピック2: 新しいAIモデル「アンソロピック」の登場
- アンソロピックは、クロードという会社が開発したAIモデルで、GPT-4以上の性能を持っていると言われている。
- 日本語の独自のコンテキストを理解し、2chのようなスレッドのような内容もシミュレートできるとされている。## トピック3: マイクロソフトのSSA活用術
- マイクロソフトの人物が、SSA(Structured Self-Assessment)の効果的な活用方法について解説している。
- プロンプトの明確な使用方法によって、効果的にSSAを活用できると説明されている。## トピック4: Googleのジェミニと多様性の問題
- Googleが開発したAIモデル「ジェミニ」が、多様性に配慮しすぎて変な画像を生成してしまう問題が話題になっている。
- 先週も取り上げられたニュースであり、今週は割愛された。## トピック5: スタックオーバーフローとGoogle Cloudの提携
- スタックオーバーフローとGoogle Cloudが提携し、新しいAIサービスが展開される予定。
- エンジニアがコード生成に活用することで、より良いコードの生成が可能になると期待されている。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-33
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第27回目の紹介
## GoogleのAIモデルの問題
- Googleが提供しているAIのモデル「ジミニ」の話題が取り上げられている。
- 一時的に人物の画像生成機能が停止したことが話題になっている。
- 生成された画像には多様性の配慮が行き過ぎているとの指摘がある。
- Googleは生成結果に対して責任を持つ姿勢を示している。## 新しい画像生成モデルの発表
- 新しいアーキテクチャを取り入れた画像生成モデル「ステーブルディフュージョン3」が発表された。
- モデルサイズの拡大だけでなく、モデルアーキテクチャ自体の改善により、より高品質な画像が生成できると期待されている。## IBMの日本語版AIモデル
- IBMが提供している日本語版AIモデル「グラナイト」が注目されている。
- 他の企業が提供しているAIモデルと比較して、IBMのモデルの特徴や用途について紹介されている。## Windows 11のAI機能
- Windows 11に搭載されるAI機能「パワーオートメイトオビアコパイロット」についての話題がある。
- AIがWindowsのさまざまな操作を自動化し、利用者の作業をサポートする機能として期待されている。## 島次郎のAIアプリ
- 島次郎という有名なキャラクターがAIアプリを開発したことが話題になっている。
- まだテスト段階であり、ユーザーのフィードバックを受けて改善が進められている。## AIの技術革新
- ビットネットという高速計算手法により、より高性能なAIが開発される可能性があるとの話題がある。
- 技術の説明が難しいため、詳細は調査が必要。## AIの著作権関連の問題
- AIの著作権に関連した問題が話題になっている。
- オープンAIとニューヨークタイムズの訴訟問題が注目されている。
タイトルや要約は AI で生成しています。
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第26回目の紹介
## 1. AAのChatbot、Bird、Googleの新機能追加- AAのChatbotであるBirdが、新しい機能を追加したことが話題になっています。
- 日本語でもいくつかの機能が使えるようになり、ネット記事でも取り上げられています。
- 例えば、話しかけた内容が正しいかどうかをチェックするボタンが追加され、情報の信頼性を確認できるようになりました。
- また、画像の生成も可能になり、日本特有の画像も作りやすくなりました。## 2. Birdがジェミニに名前変更- Birdで使用されているAIモデルの名前がジェミニに変更されることが発表されました。
- また、アプリ版の提供や、最も賢いAIモデルの有料利用が開始されるとのことです。## 3. アップルのAIに関する発表に期待- アップルもAIに注力しており、年内に何らかの発表がある可能性があります。
- 現在はクラウド上のデータセンターでAIを使用していますが、将来的にはデバイス内でのAI処理が可能になる予定です。
- ネット環境がなくても迅速に応答できるなど、セキュリティや利便性の面での価値が期待されています。## 4. 国内のAI開発の進展- 国内でもAIの開発が進んでおり、ソフトバンク、リコウ、NEC、NTTなどが新しいモデルを提供しています。
- 日本語に最適化された小型のモデルが登場し、応用範囲が広がっています。
タイトルや要約は AI で生成しています。
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第25回目の紹介
まず、先週に引き続き、Chat GPTのアップデートについて話しました。特に注目されたのは、エンベティングスモデルという検索に関連する新しいモデルです。このモデルは、文章が特定の質問に似ているかどうかを判定するために使用されます。また、チャットGPTの問いかけに対して過去の会話履歴から似たものを探し、回答を提案することもできます。このモデルは、性能が向上し、価格も安くなったため、話題となりました。次に、Google ChromeにAI機能が追加されることを紹介しました。これにより、タブの整理やメールの作成などが自動化されます。また、AIの開発プラットフォームとクラウドサービスがパートナーシップを結び、Hugging FaceとGoogle Cloudが連携することで、AIモデルの利用が容易になりました。Hugging Faceは、機械学習モデルを公開しているプラットフォームであり、Google Cloudとの連携により、AI用のコンピューティングリソースが利用しやすくなりました。さらに、データセンターの電力消費量が増加することが予測されており、AIの普及による電力需要の増加が問題となっています。そのため、電力の生産方法や消費の抑制が注目されています。また、マイクロソフトの画像生成AIであるマイクロソフトデザイナーがリリースされ、有名人のフェイク画像が出回るなどの問題が発生しました。さらに、AIを活用したゲームのリリースが増えており、既に150以上のタイトルが存在します。最後に、Googleの提供するBirdというサービスが日本語に対応し、情報の信憑性を確認する機能が追加されました。
タイトルや要約は AI で生成しています。
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第24回目の紹介
## Google ChromeのAI機能
- GoogleがAI機能を搭載したブラウザ「Chrome」を発表した。
- AI機能には、タブのグループ化や背景画像の作成、メールのドラフト作成などが含まれる。
- AI機能はまだ日本では利用できないが、注目を集めている。## AIの品質向上と画像学習の保護策
- AIの品質向上に関する取り組みが行われている。
- AIが意図しない画像を学習することを防ぐための技術サービスが登場している。
- これにより、個人のデータが学習に使用されることを防ぐことができる。## AGIの開発とオープンソース化
- マーク・ザッカー・バーグ氏がAGIの開発とオープンソース化を発表した。
- 新しいAIモデルの登場により、2024年頃にはより使いやすく、無料で利用できるAIが登場する可能性がある。## AI開発に必要なリソース
- AI開発には計算リソースが必要である。
- 効果力ファインなどの計算リソースを提供するサービスが登場している。
- さくらインターネットが提供するサービスは、月額料金がかかるが、使いやすいと評判である。
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第23回目の紹介
1. マイクロソフトの365サービスが個人利用可能になったこと
2. AIの進化が雇用に与える影響についてのIMFの発表
3. AIが国際数学オリンピックレベルの問題を解けるようになったこと
4. Googleアシスタントの不人気な機能の配信
5. AIを活用した作品が芥川賞を受賞したこと
6. オープンAI社のチャットGPTの利用ポリシーの変更
7. 東京で新しいAI企業が誕生し、資金調達に成功したこと
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-26
その他
https://www.itmedia.co.jp/news/articles/2401/18/news090.html
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第22回目の紹介 - AIの学習用の記事に対するライセンス料が話題になっている
- ニューヨークタイムスがマイクロソフトやオープンAIを訴える訴訟が起きている
- SteamがAI技術を使ったゲームの配信を開始した
- AIを使ってゲームの素材を作ることが可能になり、開発のサイクルが早くなることが期待されている
- AIが生成したものの著作権や問題性についての議論が起きている
- 2024年のテック業界やAIの変化についての予想が多く出ている
- オープンAIがGPTストアを開設し、新しい仕組みやチームプランを提供している
- マイクロソフトがパソコンの標準キーボードにパイロットボタンを付ける可能性があるという話題がある - 大規模言語モデルを活用して数理科学問題に挑戦する取り組みが行われている。 - 数学者とのコラボレーションにより、問題の解決方法を導き出すことができる。 4. AIの学習データに関する問題 - AIの学習データには、自動虐待の疑いの画像など、問題のあるデータが含まれている可能性がある。 - 大量のデータをフィルタリングすることは難しく、AIの安全性に関する課題が浮き彫りになっている。 5. AIの著作権問題に関する話題 - 文化庁がAIの著作権問題についての案を提示し、検討が進んでいる。 - AIの学習データの利用には、ガイドラインや法律に沿った形で権利を守りつつ、発展に寄与する必要がある。 6. AIの制御に関する話題 - オープンAIが弱いAIモデルで強力なAIを制御するプロジェクトを進めている。 - AIが人間を超える場合、その制御方法についてのシミュレーションが行われている。 7. オープンAIの安全性向上に関する話題 - オープンAIがセキュリティに関する諮問グループを設立し、安全性の向上に取り組んでいる。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-25
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第21回目の紹介 1. GoogleのAIモデル「Bird」の話題 - 先週、Googleが新しいAIモデル「Bird」を発表し、その関連ニュースが続いている。 - Birdは日本語対応で、GoogleワークスペースやGmailと連携することができるようになった。 2. 音楽の生成AIの話題 - マイクロソフトのCopilotと連携するAIが、音楽の作曲などに活用されている。 3. 大規模言語モデルに関する話題 - 大規模言語モデルを活用して数理科学問題に挑戦する取り組みが行われている。 - 数学者とのコラボレーションにより、問題の解決方法を導き出すことができる。 4. AIの学習データに関する問題 - AIの学習データには、自動虐待の疑いの画像など、問題のあるデータが含まれている可能性がある。 - 大量のデータをフィルタリングすることは難しく、AIの安全性に関する課題が浮き彫りになっている。 5. AIの著作権問題に関する話題 - 文化庁がAIの著作権問題についての案を提示し、検討が進んでいる。 - AIの学習データの利用には、ガイドラインや法律に沿った形で権利を守りつつ、発展に寄与する必要がある。 6. AIの制御に関する話題 - オープンAIが弱いAIモデルで強力なAIを制御するプロジェクトを進めている。 - AIが人間を超える場合、その制御方法についてのシミュレーションが行われている。 7. オープンAIの安全性向上に関する話題 - オープンAIがセキュリティに関する諮問グループを設立し、安全性の向上に取り組んでいる。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-22
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第20回目の紹介
1. Googleの新しいモデル「ジェミニ」についての話題
- 先週にも取り上げられたが、今週も話題となっている。
- バードというGoogleのモデルについても触れられている。
- プレビュー版がリリースされ、APIから呼び出せるようになったことがニュースとして取り上げられている。2. AIの作曲サービス「SUNO」についての話題
- SUNOは以前から存在していたが、最近バージョンが上がり、より高精度なものが作れるようになった。
- 特に日本語の歌詞を含めた曲作りが可能で、人気がある。3. フランスのスタートアップ「ミストラルAI」についての話題
- ミストラルAIはフランスに拠点を置くスタートアップであり、AIのモデル「ミクストラル8X7B」が話題となっている。
- ミクストラル8X7BはGPT 3.5を超える性能を持っており、実力が評価されている。4. EUのAI規制法についての話題
- EUではAIの規制法が検討されており、AIの進化と悪用の防止、企業の独占を防ぐためのガイドラインが設けられる予定である。5. 脳細胞を使ったAIのシステムについての話題
- 人間の脳の細胞を使ってAIを動かすシステムが提案され、成功例が報告されている。
- まだ課題はあるが、今後の進展に期待が寄せられている。6. 自動化ツールによるパワーポイント作成サービスについての話題
- ユーザーローカルという企業が提供する自動化ツールにより、簡単にパワーポイントが作成できるようになった。
- テンプレートを埋めるだけで作成できるため、便利なツールとして注目されている。7. AWSのサービスに関する話題
- AWSのTranscribeとBedrockというサービスを組み合わせることで、音声の要約や自動生成が可能になった。
- クラウドのAIベンダーが自社のサービスを活用する方法を提案しており、AWSの例が紹介されている。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-21
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第19回目の紹介
- グーグルが提供しているAIのBirdというサービスについてのニュースが話題になっている。
- Birdは情報収集に役立つとされており、ChatGPTとは異なる特徴を持っている。
- Googleが新しいAIモデルGeminiを発表した。
- Geminiは画像の読み込みや日本語の識別能力が高いとされている。
- Geminiは将来的にさらに高性能なモデルが出る予定である。
- GoogleのスマートフォンPixel 8にはGeminiの小さいモデルが搭載される予定であり、スマートフォンのユーザー体験が変わる可能性がある。
- AIアライアンスというコミュニティが設立され、IBMやメタ社などが参加している。
- AIアライアンスはAIの安全性に関するガイドラインを策定することを目指している。
- マイクロソフトのAIシリーズであるコパイロットとオープンAIのGPT-4 Turboが統合される予定である。
- オープンAIのサム・アルトマン氏の移動の騒動が話題になっている。
- これらのニュースについては今後の動向に注目が集まっている。
※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-20
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第18回目の紹介 - オープンAIが新しいQ-Starというものを開発しているとのニュースが話題になっている
- マイクロソフトがCopilotというシリーズを公開し、Windowsでの使用が可能になった
- AWSがAIの学習に特化した新しいプロセッサを作成し、学習コストの削減が期待されている
- AWSが企業向けのAIチャットボット「Q」を発表し、簡単に作成できるサービスが提供される
- GoogleのBirdサービスがYouTubeの動画を理解し、質問に答える機能が追加された
- 画像生成技術が進化し、AIによるアニメーションや動画の作成が高品質かつ高速に行えるようになった
- Stability AIがStable Diffusionという高速な画像生成モデルをリリースし、画像生成の速度と品質が向上した ※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-19
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第17回目の紹介
## オープンAIのサム・アルトマンCEOの解任と復帰の騒動 - 2023年11月18日、オープンAIはサム・アルトマンCEOの解任と新たな算定CEOの任命を発表 - 同社の共同創業者兼社長のグレッグ・ブロックマン氏も退陣することに - 11月19日、アルトマン氏は復帰の話し合いを行ったが、結局うまくいかず - マイクロソフトがアルトマン氏とブロックマン氏をヘッドハントし、入社することをサティア・ナデラCEOがSNSに投稿 - 11月22日、オープンAIの社員たちがアルトマン氏が復帰しなければ退社する可能性があるとする署名した - 最終的にアルトマン氏がオープンAIに復帰 ## オープンAIの動向とAIの進化と安全性の関係 - オープンAIは非営利企業であり、AIの進化を追求している - 最近は他の企業がAIを取り扱うことが増えており、オープンAIは資金を投入してAIの進化を追いかけなければならない状況にある - その結果、AIの安全性よりもAIの進化が重視されるようになった可能性がある - オープンAIの委員会の役員たちは、アルトマン氏にAIの進化だけを急がせることで安全性がおろそかになるのではないかと懸念し、解任に至ったと言われている ## 日本っぽい画像を生成するジャパニーズスタイルディフュージョンモデルの登場 - 日本の言葉や文化に特化した画像生成AIモデルが登場 - これまでの画像生成モデルとは異なり、日本独自のスタイルや日本人の好みに合った画像を生成することができる - 商用利用も可能であり、日本系の何かを生成したい場合に活用できる ## テキストから動画を生成するモデルの登場 - テキストから動画を生成するモデルが開発された - Stable Video Diffusionと呼ばれるこのモデルは、テキストから自然な動画を作成することができる - これまでの試みとは異なり、Stability AI社の開発元が影響を与え、話題となっている ## 音楽生成モデルの進化 - マイクロソフトのAIモデルにより、高品質で自然な音楽が生成できるようになった - ユーザーがクリエイティビティを発揮し、AIがそれをより良い形にアレンジすることが可能になった ※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-18
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
ポッドキャスト第16回目の紹介 ## 天気予測プログラムについて - AIが10日間の天気を1分以内で予測できるモデルが開発された。 - ニュース記事を元に猫の声で喋るように変換され、音声に起こされている。 - 気象情報は非常に複雑で予測が難しいが、ニューラルネットワークを使用して過去の気象データを学習させることで、現在の状況と6時間前の状況を入力するだけで予測できるようになった。 - モデルの精度や信頼性にはまだ課題があるが、今後の進化が期待される。 ## 商用利用可能な日本語の言語モデルについて - 日本語の言語モデル「Eliza Japanese Code Llama」が開発された。 - 日本語のデータを学習させたバージョンで、プログラムのコードの生成や保管が可能になった。 - 日本語に特化したモデルの開発が進んでおり、日本独自のニーズに対応できるようになっている。 ## YouTubeの新しいルールについて - YouTubeがAIで作られた動画が本物に見える場合、クリエーターは視聴者にそのことを明示する必要がある。 - クリエーターが明示しない場合、動画が削除されたり、YouTubeのパートナープログラムから外される可能性がある。 - 自分の顔や声が勝手に使われた場合は、削除を要求することができる。 - すべての動画が消えるわけではなく、個別に審査される。 ## マイクロソフトのイベント「MS Ignite 2023」について - マイクロソフトが開催したイベントで、AIの進化によって働き方が変わることが紹介された。 - マイクロソフトのテクノロジーを活用して、仕事のやり方を変える最新の進歩が紹介された。 - エンタープライズ向けのプラットフォームが提供され、AIを活用したさまざまなことが可能になった。 ※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-17
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
途中の音声は OpenAI の Text to speech API で作成しています。
https://platform.openai.com/docs/guides/text-to-speech