生成AIといえば、会話系のChatGPTやBing AI、Bard、画像系のMidjourney AIやDALL-E、Stable Diffusionなどが知られている。しかし今やそれに留まらず、動画や3Dデータ、ロボット制御など、さまざまなデータや物理的なメカニズムの動きまで、プロンプトから作り出せるようになりつつある。まだ実用クオリティに達していないものももちろんあるが、昨今のAIの進化の速さを考えれば、それらがモノになるのも時間の問題だ。それを象徴するのが「Text to X」という言葉で、これには、テキスト(プロンプト)から何でも作り出せるという意味が込められている。ここでは、そうした生成AIの最前線を俯瞰してみよう。
続きを読む