プロンプトエンジニアリング自体はとてもよい仕組みなのですが、これを効果的に行うには、自然な言語や身体言語による伝達とはまた別の能力が必要だと考えられています。それは本来、人間が努力して獲得すべき能力ではありません。将来的には、対話的にプロンプトエンジニアリングが施せるような仕組みの開発や、音声言語・テキストでは完全に表現しきれない部分を手話言語のようなものからうまく抽出する方法などができ、意図を伝えやすくなるのではないかと考えます。
MidjourneyやStable Diffusionにしても、今はネット上に「プロンプトでこう指示するといい絵が出力される」「こういう順番で指示すると意図した絵になる」といった、職人芸的なワザの数々が共有されている段階です。つまり、そういった特別なコツを使わなければならないという面ではまだまだユーザーに負荷がかかっており、今後、改良の余地は大いにあると感じます。
これはかつて、2000年代前半までは検索エンジンを使いこなすのにある程度コツが必要だったのに似ています。今ではある程度自然な文章で情報を探すことが可能となったように、こうした状況ももしかしたら、そう長くは続かないかもしれません。とはいえ、機械が100%、人間の意図をくむことは、まだまだ難しいと思います。やはり、テキストだけではなく繊細な表情や対話の中からくみ取れる部分を機械が補えるようになるためには、もう少し時間がかかるでしょう。
「不気味の谷」と人間の美的概念
そして倫理観
今のAIで生成される画像はアートとしては魅力的なのかもしれないのですが、個人的にはかなり不気味に見えます。これは多くの人の投入するキーワードがまだそれほど適切でないからかもしれず、クリーチャーや化け物のようなものも多く見かけます。
「今まで見たことがないようなアートが生まれている」といい意味にとらえることもできますが、これが「今までのようには作れなかった」のか「作らなかった」のか、どちらなんだろうということは考えてしまいます。