検索サービスは基本的に、人が検索したい「キーワード」をテキストのかたちで与え、そのキーワードと関連性の高い情報を出力する仕組みです。ウェブ検索ならば、ウェブ上にあるテキスト情報をクローラーと呼ばれるロボットが収集し、集めた情報に形態素解析など「自然言語処理」と呼ばれる処理を行います。そして特徴的なキーワードを索引(インデックス)として収めておき、索引を引くことによって、検索する人が一番望んでいると思われるウェブページにたどり着けるようにしています。

 これは画像検索などでも同様で、画像に説明文として付いているテキストなどを収集して処理を行います。地図検索であれば、旅行情報サイトなどにある地図上のランドマークに関する情報と緯度経度情報を組み合わせることにより、「自分が今いる場所の近くのラーメン屋さん」などを見つけることができるようになっています。つまり、どの検索でもインデックスを作るためのテキスト化がベースにあるのです。

言語だけでデザイン制作を
依頼することは非常に難しい

 私もMidjourneyやStable Diffusionで実際に画像を生成してみたのですが、そこで考えたのが「人間の思考はすべてテキストで表せるのか」ということでした。

 プロダクトマネジャーやUXリサーチャーとしての立場から考察してみると、「自分は自分が欲するものを言語化できているのか」ということは、常に検討すべきポイントになります。

 最近、仕事でターゲットユーザーの代表例となるペルソナを作ることになり、よい機会だと思って、MidjourneyやStable Diffusionを使ってその人物の画像を生成してみたのです。ところがこれが全然うまくいきません。入力するキーワードなど、いろいろと工夫してみたのですが、ずばり欲しい画像にたどり着くことはできませんでした。

 試行錯誤する中で、以前も似たような体験をしたことを思い出しました。それは、プロダクトのアイコンやロゴ、ウェブサイトなどの制作をデザイナーの方にお願いするときの感覚です。具体的に自分がどんなものが欲しいかを、デザイナーに伝えるのはすごく難しいことです。特に自分の頭の中にまだイメージがビジュアルになっておらず、「デザイナーさんと一緒に考えたい」という場合に、何をどう伝えればよいのかわからなくなることは、私にもよくあります。