
#12【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説
No se pudo agregar al carrito
Add to Cart failed.
Error al Agregar a Lista de Deseos.
Error al eliminar de la lista de deseos.
Error al añadir a tu biblioteca
Error al seguir el podcast
Error al dejar de seguir el podcast
-
Narrado por:
-
De:
ImageNetを席巻し深層学習の夜明けを告げたAlexNet (2012)、そこからPatch+Attentionで視覚にTransformerを持ち込んだViT、テキスト×画像を結び付けたCLIPへ──そしてGAN、VAE、Diffusionが拓いた画像生成の最前線へ。最後はOmni-Transformer 4oに代表されるマルチモーダルLLMまで一気通貫で解説します。
(00:00:00) イントロ — 画像AIの現在地
(00:02:12) CNN
(00:04:24) ViT:Patch+Attentionで視覚をTransformer化
(00:09:55) CLIP:Dual Encoderが拓くマルチモーダル表現
(00:18:27) GAN
(00:26:18) VAE・の生成モデル総覧
(00:33:38) Diffusion
(00:37:08) Omni-Transformer 4o
(00:47:08) スケール則でマルチモーダル問題は解決するか
SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。
海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。
▼運営会社(株式会社日本自動化技術)はこちら
https://japan-automation-technology.vercel.app
お仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。
Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976
Spotify: https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCW
X (Twitter) アカウント:https://x.com/SingularRadio
#CNN #LeNet #AlexNet #ResNet #ViT #CLIP #GAN #Diffusion #生成AI #GPT4o #OmniTransformer #Stargate #AI解説 #深層学習 #multimodal