現実認識の究極の技術 <br />「コンピュータビジョン」が進化するグーグル「プロジェクト・タンゴ」のデモビデオから

 最近よく耳にするのが、「コンピュータビジョン」という言葉である。

 コンピュータビジョンとは、簡単に言えば人間が視覚で捉えていることを、コンピュータにも行わせようというものだ。つまり、コンピュータに目を与えようという研究である。

 ただし、「見ることなど簡単ではないか」と勘違いしてはならない。人間が目で捉えたものは、脳の中で処理、認識されている。そうして、見たものが動物であるとか、その中でもネコであるとか、動いているとか、どのくらいの速さで走っているかなどを人間は理解している。モノだけではない。空間の大きさや奥行き、光の状態なども把握する。

 そもそも、家具と犬を間違えたりしない。何らかの学習作用によって、人間は目にしたものを特定のカテゴリーに分類したり、果ては危険なものが飛んで来たら、当たらないようにからだを避けたりもする。

 これだけの脳の能力をコンピュータに再現させるのは、並大抵なことではないことがおわかりいただけるだろう。コンピュータビジョンは、視覚でキャプチャーするだけでなく、AI(人工知能)や機械学習という難しい領域とも大いに重なっているのだ。

 ところが、このコンピュータビジョンの分野が今、急速に進化を遂げている。そしてそのおかげで、検索からソーシャルネットワーク、スマートフォン、ロボット、ウェアラブルまで、身の回りのテクノロジーが大きく進歩しようとしているのだ。

グーグル「プロジェクト・タンゴ」の衝撃度

 なかでも注目されるのが、グーグルが間もなく開発者向けにリリースするだろうと言われている新しいタブレットだ。これには、グーグルの「プロジェクト・タンゴ」機能が搭載されることになっている。コンピュータビジョンの威力を一般ユーザーが手にする機会は、まずここからやってくる可能性が高い。

 プロジェクト・タンゴは、現実世界を三次元で捉えることのできる機能性である。グーグルはすでにスマートフォンにプロジェクト・タンゴを搭載する計画を明らかにし、200台を限定にしてディベロッパーに開発提案を呼びかけていたが、正式な開発者向け製品は、まずタブレットで出てくるようだ。