画像生成AI分野が2022年、にわかに盛り上がりを見せている。英AI開発のStability.Aiが「Stable Diffusion」をそのモデルやソースコードも含めて一般向けに公開したのが8月末のこと。そこから1カ月ばかりで、静止画像に続いて「動画生成AI」を大手IT企業が相次いで発表している。9月末にはMetaが「Make-A-Video」、そして10月に入りGoogleが「Imagen Video」を発表した。
今回の「海外テックニュース-Trend Now」では、Googleによる動画生成AI「Imagen Video」の発表、韓国NAVERによる中古衣料品マーケットプレイス運営の米Poshmark買収について紹介する。
Googleが動画生成AI「Imagen Video」を発表、モデルやコードは公開せず
Googleの研究チームは10月6日、テキストによる指示で動画を生成可能な動画生成AI「Imagen Video」を発表した。「ボウルからエサを食べているゴッホのような画風の猫」、「ニューヨークの街中を走っているテディベア」、「岩の上で竹を食べるパンダ」といったテキストを与えると、最大5.3秒の高解像度の動画を生成することができる。Googleの研究チームは、2022年5月にテキストから画像を生成できる画像生成AI「Imagen」を発表していた。
直近ではMetaの「Make-A-Video」をはじめ、動画生成AIも続々と発表されているが、Imagen Videoの特筆すべき点はテキストをアニメーション化する能力だという。例えば「色彩豊かな、絵筆で描かれた“Imagen Video”というロゴ」というテキストを与えると、その指示内容通りに、ロゴが現れるアニメーションの動画を生成することが可能だ。
研究チームによるとImagen Videoは、Imagenの発表時と同様に安全面や社会的な影響を鑑み、現時点でそのモデルやソースコードを公開しないとしている。