我が道を行くXとApple
X(旧Twitter)が限定公開を始めた「Grok」は、英語のスラングで「~を完全に理解する」という意味の名前が与えられたように、Xのポストを利用して、回答にリアルタイム情報も含める仕組みになっている。実際の利用者の投稿(https://x.com/greg16676935420/status/1732770434720935995?s=46&t=S8miVBg8udViis45H3EX4Q)によれば、ChatGPTなどでは制約のある悪口などの生成に関する自己規制もゆるいようだ。しかし、今のところはチャット生成がメインで、多少のコーディングへの対応はあるものの、本格的なマルチモーダル化はされていないもようである。
Grokに関しては公開されたばかりで、細かな性能についても不明な点が多い。しかし、言論の自由と責任あるAIをどのようにバランスさせていくのか、そして、マルチモーダルへの対応をどのように進めていくのかが2024年の課題となるだろう。
また、生成AIの研究を進めているものの、実装レベルでは様々な処理の自動化のための機械学習が主体となっているAppleは、Appleシリコンに最適化された機械学習用のフレームワーク「MLX」を開発者向けに公開した。たとえば、言語処理系のAI処理でも、MLXのライブラリを使って行うことで、従来よりもかなりの高速化が期待できる。Appleとしては、AI関連のオンデバイス処理を迅速に行えるような環境を整え、自社製品向けのサードパーティ製ネイティブAIアプリを増やすことを目指していると考えられる。
同社の純正生成AIツールのリリースに関する動きはまだ見られないものの、社風からして、ハルシネーションが起こりうる用途への応用は考えにくい。しかし、文章の要約やデータ分析、あるいは特定のテーマに基づくプレゼンテーション構成案の作成、自動作曲などであれば、そうした心配がないため、最初に生成AI機能を組み込むとすれば、純正プロダクティビティスイートのiWork(Pages、Numbers、Keynote)や、楽曲作成アプリのGarageBandあたりになる可能性が高い。
Appleは、早ければ3月といわれるアメリカでのVision Pro発売に向けてリソースを集中させているところなので、それが一段落した初夏のWWDCでこの分野に関する何らかの発表があるものと期待される。