逆に苦手なものは、ストーリー性があったり、因果関係のある複数の文を読んで文脈を理解したうえで、解答する問題だ。

 実際の問題文ではないが、「A.彼は報告書をまた出し忘れた」「B.おまけに会議に遅刻した」という文章のあとに、続く文として以下3つの選択肢があるとしよう。

(1)私は寝坊した。
(2)会議には報告書が必要だ。
(3)彼は社会人として自覚がない。 

 東ロボくんは、A、Bと同じ単語が入っている(2)や、遅刻という単語と同じ文章に入っている確率が高い「寝坊」が含まれる(1)を選んでしまう。文脈を理解できず、自分のデータにある単語の組み合わせの頻度から推定して答えてしまうためだ。

 リスニング問題も正答率が低かった。音声から単語に変換する音声認識の能力自体はグーグルの音声認識並みに高い。しかし、会話のテーマを理解したうえで、常識的な受け応えをするという日本語なら小学生でもできることができないし、前述のように、複数の文から文脈を理解することもできないのだ。

 これを克服するには、“人間としての常識”のデータや膨大な量の複数の文のセットを用意せねばならず、コストと労力がかかりすぎ、現段階ではその方向で進化させることは物理的に不可能だ。

【国語】 実は文章の意味はわかっていない

デンソーの協力でアームを実装した「東ロボ手くん」も開発。解答用紙のマス目内に解答をボールペンできれいに書く技術も習得したが、残念ながら東大の二次論述解答は鉛筆でないと失格となってしまう

 現代文は、文中の傍線部と同じ内容の文章を選択肢から選ぶ問題が多い。選択肢に出てくる単語と本文の単語の並びや、一致率を見て答えれば、明らかな間違いである選択肢を省くことができる。二択にまで絞る精度は高くなった。

 しかし、英語と同様に表面的な単語の並びを見て処理しているので、大きな方向性では誤らないが、文章の細かい意味はわかっていない。二択から先、さらにひとつに絞るときに間違えてしまうのだ。

 また、文章の構造を把握したり、表現技法の効果を判断したり、全体のテーマを読み取ることが必要な問題にも対応できない。

 一方、古文の現代語訳は、短い文や語句であれば翻訳した後、選択肢にある単語との一致率から正答を導き出すことができる。しかし、長い文章の訳になると、やはり全体の話の流れを把握している必要があり、表面的な単語の一致だけでは、正答率が上がらない。また「こそ〜已然形」などの係り結びをうまく捉えられないことも大きな障害だ。

 さらに、和歌の問題は最初から手つかずだ。序詞や本歌取り、見立てなど、和歌の技法や、表現効果の判定を学習させることは複雑すぎて、この手の問題が出たら潔く“捨てる”しかない。

 現代文、古文とも、今以上の点数アップのためには、英語と同様、どうしても文章の意味を理解する必要があり、効率的で有効なアプローチが難しい。