ハイエンド生成AIは、もう普通の人間より賢くなっている

 ここまでたった数年で想像を超える進化を相次いで果たし、年末には高度な推論機能まで備えたAIモデルが出たものの、もうすぐそれを超えるAIモデル「o3」がリリースされると発表済み。当然、Geminiを開発するGoogleも、Claudeを開発するAnthropicも追撃することだろう。

 o3は既存のベンチマークテストでは真価を計測できず、「ARC-AGI-1」という新しいテストで87.5%というスコアをたたき出した。これは人間の平均スコアである85%を超えている。また数学オリンピックレベルの試験(AIME 2024)で96.7%の正答率を達成した。すでに人間よりも頭がいいと言っていいのではないだろうか。

2025年はAIエージェント元年!「普通の人間より賢いAI」がバーチャル同僚になるARC-AGI-1の結果。ChatGPT o3(青い点)は人間よりも賢い!?(OpenAIの公式サイトより)

 GeminiもChatGPTもマルチモーダルに対応し、テキスト以外に画像や動画、音声も利用できるようになっている。企業内部の機密情報や専門データを効率的かつ安全にAIモデルに提供する。RAG(Retrieval-Augmented Generation)という技術も普及するだろう。たとえば顧客からの問い合わせに対して、AIが数秒で社内ドキュメントを横断的に検索・分析し、最適解を返すといった流れが当たり前になる。もちろん、総務に導入し、社内からの問い合わせをさばくことも可能だ。

 これまでは、0→1のたたき台や下書きに活用していた生成AIでビジネスにそのまま使えるクオリティで使えるようになるかもしれない。すでに、プロンプトを駆使すれば、プロライターに近いレベルの原稿は執筆できるようになっている。

今年は、生成AIエージェント「バーチャル同僚」が登場

 しかし、2025年の生成AIシーンは次のステップへと進む。それが「AIエージェント」だ。生成AIはチャットや検索だけにとどまらず、雑多な事務作業やオンライン手続き、複数の情報ソースを組み合わせたスケジュール調整などを自律的に行う「バーチャル同僚」になることが期待されている。ウェブ上のさまざまなサービスやアプリケーションとシームレスにつながり、ユーザーの嗜好や行動履歴を学習しながら最適なアクションを提案するため、人間の作業負荷は大幅に減ることになる。

 たとえば、ECサイトでの買い物やサブスク管理、公共料金の契約見直しなど、煩雑な手続きをAIエージェントが自動的に実施し、最終確認だけをユーザーに求める形が一般化すると考えられている。旅行や出張の計画も、好みに合わせた複数のプランを自動生成し、スケジュール調整や予約までワンストップで完結する。こうしたAIエージェントは、個人ユースだけでなく、ビジネスシーンにも浸透し、会議のアレンジやメール文面のドラフト作成など、デスクワークの大部分をカバーすると期待されている。

2025年はAIエージェント元年!「普通の人間より賢いAI」がバーチャル同僚になるo1 proは「ビジネスパーソンがアウトプットを最大化するための10の習慣」という原稿を、一発で2万883文字を生成できる Photo by Y.T.

 最初は、「バーチャル同僚」なんて使い物にならない、という意見が飛び交うことは目に見えている。ガートナーのハイプ・サイクルでも「『過度な期待』のピーク期」から「幻滅期」に移行しつつあり、最近、メディアでも生成AIを叩く論調が目立つようになってきた。

 とはいえ、これはテクノロジーが社会に浸透する際の通過儀礼のようなもので、悪いことではない。お祭り騒ぎが一段落し、地に足を付けた活用が始まるということだ。