#12【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説 Podcast Por  arte de portada

#12【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説

#12【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説

Escúchala gratis

Ver detalles del espectáculo

ImageNetを席巻し深層学習の夜明けを告げたAlexNet (2012)、そこからPatch+Attentionで視覚にTransformerを持ち込んだViT、テキスト×画像を結び付けたCLIPへ──そしてGAN、VAE、Diffusionが拓いた画像生成の最前線へ。最後はOmni-Transformer 4oに代表されるマルチモーダルLLMまで一気通貫で解説します。


(00:00:00) イントロ — 画像AIの現在地

(00:02:12) CNN

(00:04:24) ViT:Patch+Attentionで視覚をTransformer化

(00:09:55) CLIP:Dual Encoderが拓くマルチモーダル表現

(00:18:27) GAN

(00:26:18) VAE・の生成モデル総覧

(00:33:38) Diffusion

(00:37:08) Omni-Transformer 4o

(00:47:08) スケール則でマルチモーダル問題は解決するか


SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。

海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。



▼運営会社(株式会社日本自動化技術)はこちら

https://japan-automation-technology.vercel.app

お仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。


Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976

Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCW

X (Twitter) アカウント:⁠https://x.com/SingularRadio⁠


#CNN #LeNet #AlexNet #ResNet #ViT #CLIP #GAN #Diffusion #生成AI #GPT4o #OmniTransformer #Stargate #AI解説 #深層学習 #multimodal

Todavía no hay opiniones