人工知能やクラウド技術などの進化を追い続けている小林雅一氏の新著、『生成AI――「ChatGPT」を支える技術はどのようにビジネスを変え、人間の創造性を揺るがすのか?』が発売された。同書では、ChatGPTの本質的なすごさや、それを支える大規模言語モデル(LLM)のしくみ、OpenAI・マイクロソフト・メタ・Googleといったビッグテックの思惑などがナラティブに綴られており、一般向けの解説書としては決定版とも言える情報量となっている。
同書の一部の紹介に加え、最新動向を著者・小林雅一氏に解説してもらう本連載の第2回は、ChatGPTをはじめとする生成AIの全体像をわかりやすくお伝えする。

ChatGPTのイメージPhoto: Adobe Stock

「革命」の始まり

 この約10年にわたって世界的ブームを巻き起こしたAI(人工知能)が今、次なるフェーズに突入しようとしている。それはAIが言葉の意味を理解し、私達人間(ユーザー)と自由に会話したり、共同作業したりできるようになる段階だ。具体的には何が起きているのか?

 2017年に(米アルファベット傘下の)グーグルの研究者らが画期的なAIの論文を発表。このなかで提唱された「トランスフォーマー(Transformer)」と呼ばれる新たなモデル(予測方式)により、人工知能の「最後にして最大の壁」と見られた「自然言語処理」が鮮やかなブレークスルーを遂げた。

 つまり「言葉を理解し、それを自在に操るAI」の誕生によって、AIが私達と“ごく自然に”会話できるようになったのだ。

 それが持つ意味は計り知れないほど大きい。なぜなら私達が言葉で「あれしろ、これしろ」と命令するだけで、AIがあたかも召使のようにさまざまな仕事をこなしてくれるからだ。

 たとえばコンピュータのプログラミングやデバッグ(誤り訂正)、スプレッドシート(表計算ソフト)の複雑な操作、あるいは大量文書の要約など根気の要る作業だ。

 これらに代表される多彩な頭脳労働がAIで自動化されれば、社会全体の生産性が革命的に向上するはずだが、他方で私達の仕事がAIに奪われる懸念も高まる。

 すでに兆候は現れている。2023年5月には米IBMのアルビンド・クリシュナCEOが、今後はAIでできる仕事についてはAIに任せる旨を表明した。特に人事など普段顧客に接しないバックオフィス部門(従業員数は約2万6000人)の採用は一時停止あるいはペースダウンするとした上で「今後5年間でその30%(7800人)がAIや自動化に取って代わられることが容易に想像できる」と述べた。

 そればかりではない。AIが私達のリクエストに応じて論文や小説、脚本を書いたり、絵画やイラスト、マンガ、音楽、さらにはアニメや映画のような動画作品まで創作するなど、クリエイティブな領域にも進出しようとしている。

 こちらも創作現場の生産性アップと斬新なコンテンツ出現への期待が高まる一方で、各種アーティストやクリエーター等の職業や知的財産がAIに侵される恐れも出てきている。すでに中国では一部ゲームメーカーが画像を生成するAIを使用してキャラクターや背景、ポスターなどを製作し始めたため、イラストレーターなどへの仕事の依頼が減りつつある。

 このようにプラスとマイナスの両面で突出した「モンスター」のようなAI技術が今、出現しつつあるのだ。

続々登場する、コンテンツを「生成」するAI

 こうした新種の人工知能は一般に「生成AI(Generative AI)」と呼ばれる。「ディープラーニング(深層学習)」など従来のAIは基本的に各種データの「分析」に使われてきたが、生成AIは(同じくディープラーニング技術に基づくとはいえ)文字通り「画像」や「テキスト(文章)」、「コンピュータ・プログラム」など各種コンテンツを「生成」するAIである。

 たとえば、2022年の春頃からユーザーの注文通りに玄人はだしのイラスト、絵画などを描く「DALL-E(ダリー)」や「Stable Diffusion(ステイブル・ディフュージョン)」といった画像生成AIが次々と誕生した。

各種の生成AIPhoto: Adobe Stock

 そして同年11月末には、人間とテキスト・ベースの会話ができるAI「ChatGPT(チャット・ジーピーティー)」が登場し、ツイッターのようなSNSから新聞、テレビまで各種メディアがこぞって取り上げる大きな話題となった。

 世界的な金融引き締めでIT産業が業績悪化や人員削減に追い込まれるなか、これら生成AIだけは巨額投資に支えられ(米国だけでも)450社以上のスタートアップ企業が開発を進めるなど、異例の活況を呈している。

 またグーグルやメタ(旧称フェイスブック)、マイクロソフトなどビッグテックも、次代の覇権を担うキー・テクノロジーとして生成AIの開発や関連企業への投資を加速している。

 なかでもマイクロソフトはChatGPTの開発元「OpenAI(オープン・エーアイ)」に推定で数千億から1兆円以上にも上る新規投資を決め、その技術を検索エンジン「Bing(ビング)」や主力商品「Microsoft 365(旧称オフィス)」、基本ソフト「ウィンドウズ」をはじめさまざまな自社製品に組み込んでいくなど、並々ならぬ力の入れようだ。

 これに対抗してグーグルも自主開発した対話型AI「Bard(バード)」をリリースする一方で、生成AIの技術を応用した新型検索エンジンなどの開発も急ピッチで進めている。

 言わばIT産業を代表する二大巨頭の正面衝突を中心に、再び世界的なAIブームが巻き起こりつつある。

 ボストン コンサルティング グループによれば、生成AIの市場規模は2027年に世界で1210億ドル(16兆円以上)に達する見通しだ。2022年の90億ドルと比べて約13倍と急速な市場拡大が見込まれている。平均の年間成長率は66%となる。

 1990年代の「インターネット」、2000年代の「スマートフォン」にも匹敵すると言われる「生成AI」の一大ブーム。それが私達の生活や仕事、産業界、そして「創造性」など人間固有と見られる領域にどのような影響を与えるのか?

『生成AI』では、これらをつぶさに解説している。

生成AIブームの中心にいるChatGPT

 まず2022年11月末にベータ版(試作版)としてリリースされ、今回の生成AIブームの引き金ともなった「ChatGPT」から見ていこう。

 その開発元であるOpenAI(本社:米サンフランシスコ)は、2015年に著名起業家のイーロン・マスクやピーター・ティール、サム・アルトマンらが資金を出し合って立ち上げた研究機関である。彼らは当初、総額約10億ドル(当時の為替レートで1200億円以上)を拠出すると大風呂敷を広げたが、その後マスクが約1億ドル(同120億円以上)の拠出(彼自身は「寄付」と呼んでいる)に抑えたため、実際には約1億3000万ドル(同150億円以上)がOpenAIの認めている公式の拠出額である(米ウォール・ストリート・ジャーナルなどの報道より)。設立当初は非営利団体として、単なる一企業ではなく人類全体に寄与する人工知能の研究開発を目標に掲げていた。

 当時のOpenAIには、CEO(最高経営責任者)をはじめフォーマルな経営構造が存在しなかった。恐らくAIに関するビジョンや技術力を備えた起業家や研究者など有志による、一種のプロジェクト的な存在であったと推察される。要するに正式な企業としての体裁が整っていなかったせいか、最初の頃は目立った成果を上げることができず、しばしば内輪揉めのような事態も起きたと伝えられている。

 やがて2018年にマスクが、自ら経営する電気自動車メーカー「テスラ」によるAIの研究開発(自動運転など)と利益相反する恐れがあるとの理由で、OpenAIの役職を辞して袂(たもと)をわかった。ただ、それは表向きの理由で、本当はマスクがアルトマンとの権力闘争に敗れたため、との見方もある。

 ここでアルトマンがOpenAIの初代CEOに就任すると、それまでの非営利から営利団体に転じた。つまり事実上のスタートアップ企業になったのである。ただし、親会社的な組織として当初の非営利団体も存続させ、株主へのリターンが一定の上限(出資時期に応じて出資額の7~100倍)に達したときには、それ以上のお金は非営利団体へと流れ込む決まりになっている。

 このように企業に転じて以降のOpenAIは、マイクロソフトから2019年の10億ドル(約1100億円)の初期投資を端緒に推定で総額30億ドル(同3000億円以上)もの巨額出資を受けて先端AIの研究開発を進めてきた。さらに2023年1月、マイクロソフトはOpenAIに対し今後数年間で推定100億ドル(1兆3000億円以上)もの追加投資を決めた模様と米国の一部メディアで報じられた。

 OpenAIは主に「大規模言語モデル(Large Language Model:LLM)」、つまりテキスト・ベースの大型AIを開発してきた。その詳細は後述するが、LLMとは基本的に「言葉を理解して操る人工知能」として、あらゆる生成AIのベースにある技術と考えて間違いない。

 もちろんChatGPTもLLMをベースに開発されたアプリケーションの1つだ。OpenAIのLLMは「GPT(Generative Pre-trAIned Transformer)」と呼ばれ、その後にバージョンを示す番号をつけて表示される。2023年時点の最新バージョンのLLMは「GPT-4」だ。

 ChatGPTは文字通り「チャットボット(人間とお喋りをする対話型の人工知能)」の一種だが、リリースから2か月後の2023年1月末には月間アクティブ・ユーザー数が推計で1億人に達し、世界有数の金融機関UBS(本社:スイス)から「史上最速のペースで成長している一般消費者向けアプリケーション」と認定された。

 また同年3月には、ChatGPTの月間ビジター数が延べ人数で約16億人に達した。これはグーグルの同753億人には遥かに及ばないが、デビューからわずか4か月で老舗マイクロソフトの検索エンジン「Bing」の同9億5700万人を大きく上回る結果となった(イスラエルのインターネット・トラフィック調査会社Similarwebより)。

 なぜ、これほど大きな関心を集めたのだろうか?

 主な理由はChatGPTの並外れた言語処理能力である。政治・経済・文化・歴史・科学技術をはじめ、ほぼあらゆる分野の質問に対し、概ね適切で筋の通った答えを返してくる。従来のチャットボットが私達の言うことをほとんど理解できず、しばしば頓珍漢な答えを返して、ユーザーを白けさせてきたのとは大きな違いである。