画像生成AIが苦手な文字生成もこなす
Google「Ideogram」
画像生成AIは、(サービスにもよるが)かつて苦手だった指先や顔の表情などの表現がかなり改善してきている。しかし、今もほとんどすべてのサービスで上手に生成できない要素に、文字や単語がある。つづりを指定したプロンプトで指示すると、それらしい文字列は生成するものの、つづりの一部が間違っていたり、存在しない文字(のようなグラフィックス)だったりするのだ。
Googleが開発し、無料で公開されているIdeogram(イデオグラム)は、この課題に挑戦し、かなりの成果を上げることができている画像生成AIだ。通常の画像生成AIとしても利用できるが、画像内に入れ込みたい文字列(現状、アルファベットのみ)をプロンプト内に明示的に記述すると、雰囲気に合うフォントによって描かれるようになっている。とはいえ100%完璧ではなく、指定したテキストのない画像も生成されたり、単語数が多いと反映されない場合もあるが、かなりの確率で絵柄とマッチするようなフォントを使って描画される。
ここでは、「ダイヤモンド」という名前の雑誌の表紙をイメージして、スタイリッシュなデザインを依頼してみた。プロンプトは、Create a magazine cover with the word
"Diamond" featuring topics of startup companies.(スタートアップ企業のトピックをフィーチャリングした「Diamond」の文字がある雑誌の表紙を生成して)というもので、さらに画像スタイルとして、poster、fashion、portrait photographyを選択している。結果、一度に四つ生成される画像のうち1枚のみ文字がなかったが、残りの3枚は、それなりにまとまりのある表紙のイメージが作られた。
その中から、最もビジネス寄りと思われる男性のイメージを選択してみると、片方の目や指先に不自然な表現が見られる。また、背景の微妙なグラデーションの上に描かれた細かな文字のように見える部分も、一見、表紙風ではあるが、無意味なグラフィックスとなっている。
通常、こうした箇所を自然な仕上がりで修正するには、それなりのテクニックが必要となるのだが、生成AIはこのような場合にも活躍する。ここで利用したのは、Adobe Fireflyの無料Webアプリ版に用意されている「生成塗りつぶし」だ。
不自然な箇所や不要な部分を範囲指定して、プロンプトを空欄にして生成すると、画像を分析して、適切に修正、もしくは消去してくれる。この連携処理は、AI生成された画像の不具合を直す手軽な方法として、覚えておいて損はないだろう。