
Illustration: Thomas R. Lechleiter/WSJ, iStock
【サウスサンフランシスコ(米カリフォルニア州)】人間に代わって複雑な作業を実行できる有用な人工知能(AI)エージェントの開発競争が新たな難題に直面しようとしている。
AIエージェントの中核をなす大規模言語モデル(LLM)には多くの作業をこなす実力があるが、エージェント内部のLLMと、エージェントが作業を実行するのに必要なツールとを接続させることがますます重視されている。
例えば、最新のLLMは複雑な掛け算を間違えることがあるが、最も旧式な最安モデルは、計算ツールがあれば試験で高得点を取ることができる。
しかし課題は他にもある。AIエージェントがウーバーを呼んだり航空券を予約したりするようになる――こうした期待はこの1年の間に形成された――のであれば、アプリやAPI(アプリケーション・プログラミング・インターフェイス)、ウェブサイトにアクセスする許可が必要になる。
新興企業アーケード・ドット・デブのアレックス・サラザー最高経営責任者(CEO)によると、人間が自分のアカウントにサインインするには、パスワードを入力するか、顔認証や指紋認証を利用するが、AIエージェントが「人間」と「人間が利用したいサービス」との仲介役になるには新たな認可方式が必要だ。
AIエージェントを約束
アップル が昨年6月の開発者会議で上映した録画のプレゼンテーションでは、機械学習・AI部門の幹部の一人が、同社の音声アシスタント「Siri(シリ)」に、自分の母親が乗っている飛行機がいつ着陸するかを尋ねてみせた。Siriは母親がメールで送ったフライト情報をリアルタイムのフライト追跡情報と突き合わせて最新の到着時刻を特定した。
次に母親との昼食の予定について詳しく教えてと言うと、Siriはこの幹部のスケジュールかテキストメッセージを確認して予定を確かめた。その上で空港から店まで実際にどのくらい時間がかかるかをはじき出した。