Episodios

  • ChatGPTの次は「夢見るAI」:自分で作った仮想世界で訓練するDreamer 4の可能性
    Oct 3 2025

    今回は、2025年に発表されたばかりの革新的なAI技術「Dreamer 4」について解説します。

    「AIが夢の中で学習する」という一見不思議な表現で語られるこの技術は、AIエージェントが自ら生成した仮想世界の中で試行錯誤を重ね、現実世界の課題を解決できるようになるという画期的なものです。番組では、なぜこうした技術が必要なのか、どのような仕組みで実現されているのか、そして実際にどんな成果が出ているのかを説明しています。

    特に注目していただきたいのは、Minecraftでの「ダイヤモンド取得」という最難関タスクへの挑戦です。20,000回以上の操作が必要なこの課題を、AIが現実環境との接触なしに、完全にオフラインで学習して達成したという成果は、AI研究における大きなブレークスルーと言えます。しかも、必要なデータ量は従来手法の100分の1という効率性も実現しています。

    番組では、この技術が持つ可能性についても触れています。自動運転AIの安全な訓練、工場ロボットの効率的な学習、医療ロボットの手術訓練など、現実では危険やコストが伴う様々な分野への応用が期待されています。

    Paper: https://arxiv.org/abs/2509.24527

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    10 m
  • なぜ今『AIのチーム戦』が注目されるのか :Mixture of Thoughtsが実現する新しいAI連携
    Oct 1 2025

    今回は、2025年に発表されたばかりの画期的なAI技術「Mixture of Thoughts(MoT)」について、分かりやすく解説しています。

    複数のAIが協力して問題を解く―そんなSFのような技術が現実になりつつあります。従来は、各AIが独立に回答を出してから統合する方法が主流でしたが、MoTは全く異なるアプローチを採用しました。それは、AIモデル同士が「思考の途中経過」を共有しながら、リアルタイムに協調して答えを作るというものです。

    番組では、AI博士との対話を通じて、この革新的な技術の仕組みを身近な例えで解説しています。数学の先生と国語の先生が協力して問題を解く様子になぞらえたり、人間のチームワークとの類似点を探ったりしながら、技術的な内容を噛み砕いてお伝えしています。

    特に注目すべきは、MoTが既存のAIモデル資産を活用できる点です。企業が個別に開発してきた専門AIを、わずか3%程度のパラメータ追加で連携させられるという実用性の高さは、今後のAI活用に大きな影響を与えるでしょう。

    実験結果では、7Bパラメータ級の中規模モデル群が協調することで、単体の巨大モデルを約10%上回る性能を達成。さらに、未知の問題への対応力でも優れた結果を示しています。

    Paper: https://arxiv.org/abs/2509.21164

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    11 m
  • なぜAIは『考える時間』が必要だったのか?Princeton大の衝撃研究が示すLLMの未来
    Sep 29 2025

    今回は、AI開発の常識を覆す画期的な研究成果について解説しています。

    2025年9月にPrinceton大学から発表された論文によると、わずか80億パラメータのAIモデルが、その10倍以上の規模を持つ巨大モデル、さらには一部の評価ではGPT-4をも上回る性能を達成しました。その秘密は「RLMT」と呼ばれる新しい学習手法にあります。

    番組では、AIニュースキャスターのらみとAI博士が、この技術の核心を対話形式で分かりやすく解説します。「AIに考えさせてから答えさせる」というシンプルなアイデアがなぜこれほど効果的なのか、従来の「大きければ大きいほど良い」という常識がなぜ覆されたのか、そして私たちの生活にどのような影響をもたらすのかを、専門用語を極力避けながら説明しています。

    特に興味深いのは、この手法がわずか7,500件のデータで、数千万件のデータを使った従来手法を上回った点です。これは、中小企業や研究機関でも高性能なAIを開発できる可能性を示唆しており、AI民主化への大きな一歩となるかもしれません。

    Paper: https://arxiv.org/abs/2509.20357

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    9 m
  • 「動画AIが"眼で考える"時代へ」迷路を解き、物理法則まで理解するGoogle DeepMindの衝撃
    Sep 28 2025

    今回のテーマは「動画AIが"眼で考える"時代へ」。2025年9月にGoogle DeepMindが発表した、コンピュータビジョン分野の常識を覆す研究について解説します。

    これまで画像認識の世界では、物体検出にはYOLO、セグメンテーションにはSAMといったように、タスクごとに専門のAIモデルが必要でした。しかし、動画生成AI「Veo 3」は、画像とテキスト指示を与えるだけで、62種類もの視覚タスクを追加学習なしで実行できることが実証されました。

    番組では、Veo 3が迷路を解く様子や、物理法則を理解して石は沈み、ペットボトルのキャップは浮くことを正しく表現する能力など、具体例を交えながら解説。特に注目すべきは「Chain-of-Frames」という概念。これは、LLMが文章で段階的に考えるように、動画モデルがフレームごとに視覚的な推論を行うプロセスです。

    また、前バージョンのVeo 2から、わずか数ヶ月で迷路解決の成功率が14%から78%に向上したという驚異的な進化速度や、プロンプトの書き方次第で性能が大きく変わるという興味深い発見も紹介。現時点での課題や失敗例も含め、バランスの取れた視点で技術の現在地をお伝えします。

    視覚AIが「見て、理解し、考える」能力を獲得しつつある今、私たちはコンピュータビジョンの「GPT-3モーメント」に立ち会っているのかもしれません。

    Paper: https://arxiv.org/abs/2509.20328

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    11 m
  • LLMの次はこれだ:Appleが実現した画像・動画・3Dを『統一言語』で扱う万能AI
    Sep 28 2025

    今回は、Appleが発表した革新的な視覚AI技術「ATOKEN」について解説しています。

    現在のAIは、画像認識、動画生成、3Dモデリングなど、目的ごとに異なるモデルが必要です。しかしATOKENは、これらすべてを単一のモデルで処理できる統一的なフレームワークを実現しました。さらに驚くべきは、従来トレードオフの関係にあった「意味を理解する能力」と「精密に再現する能力」を両立させた点です。

    番組では、なぜこれまで視覚AIが統一できなかったのか、ATOKENがどのように「4次元統一空間」という独創的なアイデアでこの問題を解決したのかを、具体例を交えながら解説します。また、13万8千GPU時間という膨大な計算資源を投入して行われた段階的学習の工夫や、動画や3Dの学習が画像の性能を向上させるという「正の転移」現象についても詳しく説明しています。

    ImageNetで82.2%という高い認識精度を達成した実際の性能データや、今後のAI開発にどのような影響を与えるかという将来展望まで、幅広くカバーしています。

    Paper: https://arxiv.org/abs/2509.14476

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    8 m
  • AIの常識を覆した78個の"良い手本":1万件のデータを凌駕した新原理
    Sep 27 2025

    今回は、AI開発の常識を根底から覆す画期的な研究について解説しています。

    清華大学とスタンフォード大学の研究チームが発表した「LIMI(Less Is More for Intelligence)」という新手法は、わずか78個の厳選されたデータで、1万個のデータを使って学習した従来のAIモデルを大幅に上回る性能を実現しました。これは実に128倍という驚異的な効率改善を意味します。

    番組では、この革新的な研究成果を分かりやすく解説。「質問に答えるAI」から「実際に仕事をこなすAIエージェント」への進化、そして「データの量より質」という新しいパラダイムシフトについて、具体例を交えながら紐解いていきます。

    特に注目すべきは、この技術が産業界にもたらす影響です。これまで数千万円から数億円かかっていたAI開発が、良質なデータの戦略的選定により、中小企業でも手の届く範囲になる可能性があります。また、環境負荷の観点からも、少ないデータで済むことは計算資源の削減につながり、持続可能なAI開発への道を開きます。

    Paper: https://arxiv.org/abs/2509.17567

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    10 m
  • 「聞く」AIから「聞き耳を立てる」AIへ:次世代アシスタント『盗み聞きエージェント』
    Sep 27 2025

    今回は、AIアシスタントの新しい形として注目される「オーバーヒアリングエージェント(盗み聞きエージェント)」について、AI博士と共に詳しく解説しています。

    「Hey Siri」や「OK Google」と呼びかけなくても、AIが人間同士の会話を理解して、必要なタイミングで支援を提供する——そんな未来のAIアシスタントの姿を、具体的な活用シーンを交えながら分かりやすく紹介します。

    番組では、医療現場での診察支援、会議での日程調整、家族の旅行計画など、身近な例を用いて、この技術がどのように私たちの生活を変える可能性があるのかを探ります。同時に、常に会話を聞かれることへのプライバシーの懸念や、AIが人間の意図を正確に理解することの技術的な難しさについても、率直に議論しています。

    ペンシルベニア大学の最新研究論文をベースに、この新技術を理解するための6つの分類軸(起動タイミング、入力形式、提示方法など)を整理し、GitHub Copilotなど既に実用化されている事例から、将来の教育・医療・ビジネス分野での応用可能性まで幅広くカバーしています。

    AIの便利さと人間の創造性のバランス、技術の倫理的な使い方など重要なトピックも含まれています。

    Paper: https://arxiv.org/abs/2509.16325

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    10 m
  • AIが150回で世界記録更新:Sakana AI発オープンソース『ShinkaEvolve』の衝撃
    Sep 25 2025

    今回は、2025年9月に発表された革新的な技術「ShinkaEvolve」について、AI博士と共に分かりやすく解説します。

    プログラムが自ら進化し、新しいアルゴリズムを自動的に発見する――そんなSFのような技術が現実のものとなりました。Google DeepMindのAlphaEvolveが数千回の試行を必要とした問題を、ShinkaEvolveはわずか150回で解決。しかも、その技術は完全なオープンソースとして誰でも利用可能です。

    番組では、この驚異的な効率化を実現した三つの革新的技術について、身近な例えを使いながら解説します。レストラン選びに例えた「探索と活用のバランス」、工場の品質管理になぞらえた「新規性フィルタ」、カジノのスロットマシンで説明する「LLMの動的選択」など、専門知識がなくても理解できる内容になっています。

    実際の成果として、円充填問題での世界記録更新、数学競技問題を解くAIエージェントの設計、競技プログラミングコードの改良など、多様な分野での応用例も紹介。人間のトップ競技プログラマーが作ったコードを、AIがさらに改良した事例は特に興味深いものです。

    Paper: https://arxiv.org/abs/2509.19349

    Book: https://amzn.to/4nAM1zw

    note: ⁠⁠⁠https://note.com/rami_engineer⁠⁠⁠

    X: ⁠https://x.com/rami_engineer⁠

    Más Menos
    8 m