画像生成AIが苦手な文字生成もこなす
Google「Ideogram」

 画像生成AIは、(サービスにもよるが)かつて苦手だった指先や顔の表情などの表現がかなり改善してきている。しかし、今もほとんどすべてのサービスで上手に生成できない要素に、文字や単語がある。つづりを指定したプロンプトで指示すると、それらしい文字列は生成するものの、つづりの一部が間違っていたり、存在しない文字(のようなグラフィックス)だったりするのだ。

 Googleが開発し、無料で公開されているIdeogram(イデオグラム)は、この課題に挑戦し、かなりの成果を上げることができている画像生成AIだ。通常の画像生成AIとしても利用できるが、画像内に入れ込みたい文字列(現状、アルファベットのみ)をプロンプト内に明示的に記述すると、雰囲気に合うフォントによって描かれるようになっている。とはいえ100%完璧ではなく、指定したテキストのない画像も生成されたり、単語数が多いと反映されない場合もあるが、かなりの確率で絵柄とマッチするようなフォントを使って描画される。

IdeogramIdeogramでは、イラストのアクセントとなるフレーズやシャツに描かれた名前が、絵柄にうまく融合した形で生成される。 拡大画像表示

 ここでは、「ダイヤモンド」という名前の雑誌の表紙をイメージして、スタイリッシュなデザインを依頼してみた。プロンプトは、Create a magazine cover with the word
"Diamond" featuring topics of startup companies.(スタートアップ企業のトピックをフィーチャリングした「Diamond」の文字がある雑誌の表紙を生成して)というもので、さらに画像スタイルとして、poster、fashion、portrait photographyを選択している。結果、一度に四つ生成される画像のうち1枚のみ文字がなかったが、残りの3枚は、それなりにまとまりのある表紙のイメージが作られた。

 その中から、最もビジネス寄りと思われる男性のイメージを選択してみると、片方の目や指先に不自然な表現が見られる。また、背景の微妙なグラデーションの上に描かれた細かな文字のように見える部分も、一見、表紙風ではあるが、無意味なグラフィックスとなっている。

雑誌の表紙をイメージしたグラフィックスを生成させたところ、4枚中3枚に、プロンプトで指定した“Diamond”の文字が適切な位置に配されて描かれた。雑誌の表紙をイメージしたグラフィックスを生成させたところ、4枚中3枚に、プロンプトで指定した“Diamond”の文字が適切な位置に配されて描かれた。 拡大画像表示

 通常、こうした箇所を自然な仕上がりで修正するには、それなりのテクニックが必要となるのだが、生成AIはこのような場合にも活躍する。ここで利用したのは、Adobe Fireflyの無料Webアプリ版に用意されている「生成塗りつぶし」だ。

 不自然な箇所や不要な部分を範囲指定して、プロンプトを空欄にして生成すると、画像を分析して、適切に修正、もしくは消去してくれる。この連携処理は、AI生成された画像の不具合を直す手軽な方法として、覚えておいて損はないだろう。

それでも、目や指先、細かな文字に不自然な箇所があったため、Adobe Fireflyの「生成塗りつぶし」を利用して修正した。この状態から、必要に応じて文字などをグラフィックツールで追加していくことで、より完成度を高めることができる。それでも、目や指先、細かな文字に不自然な箇所があったため、Adobe Fireflyの「生成塗りつぶし」を利用して修正した。この状態から、必要に応じて文字などをグラフィックツールで追加していくことで、より完成度を高めることができる。 拡大画像表示