Stable Diffusion

Midjourneyと同様に、入力したテキストをもとに画像を生成する。オープンソースとして公開されているため、多くの画像生成AIのベースがこのStable Diffusionとなっている。音声、動画、3D、コードなどへの対応も予定している。

Alpaca

Stable DiffusionをPhotoshop上で利用し、画像を生成した上で編集することも可能とするためのプラグイン。マイクロソフトリサーチの元機械学習エンジニア、ウィリアム・ブッチウォルター氏が開発しており、現在プライベートベータ版の利用者を募集している。

動画生成AI

Runway

AIを活用した動画編集ツール「Runway」では、自然言語をもとに動画を生成する新たなツールを開発しており、現在ウェイトリストを通じて利用者を募集している。

音楽生成AI

Mubert

入力したテキストをもとに、動画やポッドキャスト、アプリなどに利用するための音楽を作成できる。

 

スピーチ生成AI

Podcast.ai

AIが生成したポッドキャストを配信する。コメディアンのジョー・ローガン氏とスティーブ・ジョブズ氏による約20分の架空のトークショーを公開し、海外のネットユーザーのあいだで話題となった。公式ウェブサイト上ではネタ案を一般募集している。

Resemble.ai

アップロードした発話のデータをもとに、ユーザーの声の“クローン”を生成。入力したテキストをしゃべらせることなどが可能だ。

テキスト生成AI

COMPOSE AI

ユーザーが入力したテキストの続きをサジェストしたり、より適切な文章の候補を教えてくれるAI。Chromeのエクステンションとして無料で提供されている。米国の名門アクセラレータ・Y Combinatorなどから出資を受けている。

テキスト生成AI「COMPOSE AI」
テキスト生成AI「COMPOSE AI」 公式サイトより

Character.ai

実在する人物や架空のペルソナとの、虚構のテキスト対話を実現する、チャットボット生成AI。サイト上ではTesla CEOのイーロン・マスク氏や米大統領のジョー・バイデン氏といった有名人や、リスや犬といった動物など、さまざまな人物やキャラクターを模したチャットボットが公開されている。

チャットボット生成AI「Character.ai」
チャットボット生成AI「Character.ai」 公式サイトのスクリーンショット

画像生成AIを中心に利用が進む生成AI。今はまだ、MidjourneyやStable Diffusionといった著名なものでさえ、AIのクセが強く、ユーザーの望み通りの、実用に耐え得るクオリティのコンテンツを生成するのは困難だ。

だが、Stability AI CEOのエマード・モスターク氏は以前の取材で「Stable Diffusionの国別モデルを作る予定だ」と話していた。今後、地域やニーズ、用途に合わせたモデルが数多く登場していくことで、生成AIの実用化は本格化していくだろう。