機械は人間と同じ
言語学習能力を持っているか

秋山 翻訳の研究を進める中で、実は人間の思考はこうなっているのか、と膝を打つ瞬間なんかはありますか。

永田昌明ながた・まさあき/NTTコミュニケーション科学基礎研究所 協創情報研究部 言語知能研究グループ 上席特別研究員。1985年京都大学工学部情報工学科卒業。1987年京都大学大学院工学研究科情報工学専攻修士課程修了。NTT入社。専門は文脈・状況に基づくニューラル機械翻訳。機械翻訳、質問応答、固有表現抽出、文字認識誤り訂正、日本語形態素解析、 統計的対話モデル、HPSGに基づく構文解析など多数のプロジェクトに参画、論文多数。同志社大学非常勤講師も務める。

永田 前回お話しした多言語BERTの研究をしていると、穴埋め問題を解く能力があれば、異なる言語で(一対一対応の対訳ではない)異なるテキストを学習しても、言語によらず、類似した意味を持つ単語は近くに配置されます。それぞれの言語で入力すると、出来上がる中の理解は、どの言語であっても仕上がりは似たようなものになる。この単語ベクトルの配置が「意味の体系」あるいは人間が実世界をどう認識しているかという「世界観」のようなものを表現すると思うと、穴埋め問題を解く能力が人間に共通に備わっている(遺伝する)と仮定するだけで、言語の普遍性を説明できそうに見えて大変興味深いと思っています。世界中にさまざまな人がいて、さまざまな言語を話していますが、人間が内部で持っている言語体系の仕組みはなんとなく似ているのではないかと。

秋山 それはどんな言語でも、その中の言葉のベクトル構造の相似性や関係性が同じだということですか。

永田 そうですね。これとこれは似ている、こうなったらああなるという感じで理解されるものは、出発点は別の言語で入力しても、出来上がる世界はなんとなく似ている。言語学では、言語を理解したり、話す能力がどのくらい遺伝子に組み込まれているのかというのを言語の生得性というのですが、別に遺伝子に組み込まれている必要はないんじゃないかと思うのです。穴埋めタスクの学習は文のどこかを隠されて、そこに入る言葉を当てる機能ですが、ある基本的な機能が存在していて、それだけで世界を理解する状態は後天的につくれるということを意味している。

秋山 人間は目が二つあって、真ん中に鼻があって、というふうに基本的なありようはみんな似ている。確かに国や民族によって、世界をどのように分節化するか、言語化するかということに関して、差異があったりはするけれど、ただ、それでも結局は似たような体系に落ち着くということですよね。

永田 そうなんですが、その似たようなものになるところまでが、厳密に遺伝子に入っているのかというと、多分そうではない。入力されたもの、あくまで外側から受けた信号によって、結果的にかなり似た世界の認識がつくられる気がするんです。だから、世界観まで遺伝しているわけではないだろう。コンピューターの動きを見ていると、実際世界観みたいなものをコンピューターはゼロからつくれてしまうので、それは遺伝情報で持っている必要はないと思うんですよね。言語に関して、どこまでが人類の遺伝子として持っている能力で、どこからが後天的に獲得したものかという境目には意外に高い壁はないのかもしれない。

秋山 日本人の子どもでもアメリカで育てば英語を話せるようになる。言語学では、人間には構文やある程度の文法の仕組みを体系的に習得する能力が生得的に備わっていて、それは言語によらず、普遍的であるという、ノーム・チョムスキーという人が唱えた生成文法という考え方が優勢ですが、その説を覆すかもしれないということでしょうか。

永田 チョムスキーの流れをくむ生成文法を信じる人たちは、その普遍的な言語能力とは、構文を解析する能力だと言っています。けれども、最近のニューラルネットに基づく言語処理を見ていると、ニューラルネットは入力と出力だけで言語を習得しているかのように見えるので、構文解析ほど複雑ではないシンプルな能力が人間に備わっている(遺伝する)ことが、言語能力だと仮定できるような気がするのです。私は言語学者ではないので、それについて断言はできませんが。