AIのイメージ写真はイメージです Photo:PIXTA

「空間認知」AIモデルの研究が加速するワケ

 ここへ来て注目されるケースの一つは、空間を認知し、意思決定を行うAIの開発である。ChatGPTやグーグルの「Gemini(ジェミニ)」は言語をデータとして学習し、原因と結果の推論などを行うものだ。

 それに対して、LWMと呼ばれる空間認知モデルは、3次元空間を認知し状況を理解し、必要と考える意思決定を行う機能を持つ。生成AIに加え、空間認知能力を持つAIがロボットに実装されると、ロボットは自律的に周囲の環境を理解し、複雑な作業を行うようになるとみられる。

 今の一般的なロボットのイメージは、飲食店で注文したメニューを運ぶとか、生産現場であらかじめ設定された業務を行うものだろう。だが、空間認知能力をAIが持つと、まさに「ドラえもん」のように、騒々しい環境の中で特定の人物の声に耳を傾け、感情を理解するITデバイスが登場する可能性が高まる。

 この分野で注目の研究者の一人が、グーグルで空間知能などの研究を行い、現在はスタンフォード大学にて「人間中心のAI研究所」(Human-Centered AI)で共同所長を務めるフェイ・フェイ・リー(李飛飛)氏である。空間認知能力を備えたAIの開発を主導した功績などから、リー氏は「AIのゴッド・マザー」と呼ばれている。

 リー氏は、World LabsというAIスタートアップをイギリスで設立した。同社は設立間もないものの、投資企業による評価額は1500億円近くに達したと報じられている。

 言葉で人間とコミュニケートする生成AIに加えて、私たちと同じように実社会を認知するAIがもうすぐ出現するかもしれない。自動運転などの開発、人手不足などさまざまな社会課題を解決する期待は高まっている。リー氏が進める空間認知AI開発に関しては、ChatGPT に次ぐイノベーションになりそうだとの指摘も多い。