クラウドではなくデバイス側での
AI処理に特化したプロセッサーも

 現状の生成AIなどは、NVIDIA A100/H100のようなGPUと大量の演算ができるコンピューティングパワーを必要とします。このため、データをクラウドへ転送して、クラウドで計算処理した結果を再び手元のデバイスへ持ってくるかたちが主流です。しかしこの方法では入力から処理、表示までに時間がかかります。

 この課題を解決するために、2つの考え方があります。ひとつは情報伝送の速度を上げること。もうひとつは「エッジコンピューティング」、クラウド側へデータを転送して処理するのではなくデバイス側(エッジ)で演算処理を行うことです。

 伝送速度の向上について、NTTは「IOWN(アイオン:Innovative Optical and Wireless Network)」という構想を立てています。構想は3つの柱となる技術、オールフォトニクスネットワークとデジタルツイン、認知基盤技術から構成されますが、このうちのオールフォトニクスネットワークが特に重要です。

 オールフォトニクスネットワークとは、電気信号で行われている通信をすべて光に置き換えようという考え方です。私たちは今でも光回線(光ファイバー網)をインターネット接続に利用していますが、この光をネットワーク上のすべて、たとえばストレージの中からコンピューター内の部品を通ってルーターを経由し、別のデバイスへたどり着くまでの通信などでも利用すれば、もっと高速にデータのやり取りができるはずです。

 オールフォトニクスネットワークになれば、通信速度向上だけでなくエネルギー効率も大幅にアップします。IOWNが実現すれば、これまでエッジ側で行っていた処理をクラウド側へ送り、精度を上げて行うことも可能になります。

 ただ、それでもエッジ側で処理を完結する方が速いことは確かです。またプライバシーとセキュリティの観点から、エッジコンピューティングへのニーズはなくならないでしょう。たとえばiPhoneは、顔認識などのセキュリティ認証をクライアント側で完結しています。同様に、クラウド側に送信したくないセンシティブなデータはたくさんあります。こういうデータを処理するにはエッジコンピューティングの方が適しています。インターネットにつながっていない工場で取得したデータを処理したいときなど、オフラインで動作しなければならないケースもあります。

 エッジAI処理に特化した日本発のスタートアップも登場しています。2019年設立のEdgeCortix(エッジコーティックス)は、高速・低遅延で低消費電力のエッジAIに特化したプロセッサーを一から設計し、推論処理を高速化するAI推論アクセラレーターを搭載したエッジ向けのAIプラットフォームを提供しています。

 今後もこうしたスタートアップが現れると考えれば、NVIDIA一強の情勢がひっくり返る可能性は、まだまだあるのではないかと思います。