今後、Stability AIでは音声・動画に対応した「DreamStudio Pro」や、詳細は明確でないが「Dream Studio Enterprise」の提供も予定。同社の創業者であるエマード・モスターク氏は「来月には音声、その後は3Dや動画にも対応していく」とツイートしている。

モスターク氏はまた、Stable Diffusionを開発した理由について、機械学習の研究者でYouTuberでもあるヤニック・キルチャー氏のインタビューで「10億人の人々をクリエイティブにしたかった」と説明している。

「Stable Diffusionの強みは、クオリティの高さ、スピードの速さとコストの低さです。DALL・E 2も素晴らしかった。ですが、Stable Diffusionの方が30倍ほど効率的で、一般的なPCのグラフィックボードでも使えます。(画像生成AIを)100万人ではなく、10億人もの人々が使えるテクノロジーにしたかったのです」(モスターク氏)

モスターク氏は「PowerPointを破壊したい。私たちが本気を出せば、数年後にはスライドを作る必要がなくなるかもしれません。パソコンに指示を出すだけで済むようになれば、世界に多くの幸せをもたらすでしょう」とも述べている。どれだけ本気かは定かではないが、同氏の頭にはStable Diffusionのさまざまな応用案がありそうだ。