この話を聞いたニューヨーク在住の別のメンバーからは、渡米したばかりのころに英語で感情を表現することに苦労した話も出ました。彼は米国のMBAも取得していて、基本的な英語には苦労しないのですが、「形容詞」に困ったというのです。感情を表現する言葉や言い回しは言語によって異なります。日本語で思い描いた感情を英語の形容詞でどのように表現すればピッタリくるのか、それが出てこなかったといいます。

 BGM検索の話は、画像生成と同じように楽曲やサウンドを言葉で伝えることの難しさを表しています。私がデザイナーに希望を伝えるのに苦労したように、サウンドクリエイターのようなアーティストに楽曲の希望を伝えることも難しいことです。それが生身の人間ではない、検索エンジンという「機械」相手にさらに顕在化したのがこの例でしょう。

 英語の形容詞の例は、人間同士であっても感情を伝えることの難しさを象徴するものだと思います。感情や意思、意図を伝えることの難しさは従来からあったことで、それが現在はAI相手に、より顕在化したという話なのではないかと思います。

入力の工夫でAIの出力をより良くする
プロンプトエンジニアリング

 我々はデザインや味について、デザイナーやソムリエに自分の意志を音声言語を通じて伝えるときには、ボディランゲージや顔の表情でも何らかの情報を発信しています。言語の中には手・指や体の動きなどを使って聴覚に障害のある人と意思を伝え合う手話言語もありますが、現時点で画像生成AIが対象とするのは、音声言語をテキスト化したものだけです。

 人間は言語にする前に頭の中に何かしらのイメージがあります。本当は直接それを伝えられればよいのですが、今のところ、その方法はありません。またボディランゲージや視線、表情といった情報も、音声言語、中でもテキストだけとなったときには、かなりの部分が欠落してしまっているはずです。

 AIにテキストで意思を伝達するときに、この欠落をうまく補おうという技術が「プロンプトエンジニアリング」です。プロンプトエンジニアリングでは、AIに与える入力(プロンプト)を工夫することで、AIからの出力をより良くすることができます。例えれば算数の文章題に対して正解の数字だけを示すのではなく、解き方を順番に示していくことで、物事を順番に考えることをAIに促すのです。