第12回 衝撃!グーグルの猫論文~3日間、1000万枚の画像を見続けた結果
さて最新の人工知能研究には、脳そのものをシミュレーションする研究のほかに、もう1つの大きな流れがあります。それは、今一番ホットな人工知能の学問=ディープラーニング(深層学習)の登場です。
ディープラーニングとは何かを説明する前に、その成果を紹介しましょう。
ディープラーニングの人気に火をつけることになったのが、2012年開催された一般物体認識のコンテスト(ILSVRC)です。その後、ディープラーニングのすごさを人々に知らしめたものに2014年、Facebookの開発した顔認識技術があります。精度97.53%という人間のレベルとほぼ互角の認識精度を記録したことが発表されました。ディープラーニングを用いた顔認識の精度は今なお向上しています。
しかしさらに衝撃的なのは、顔認識技術の少し前の2012年に発表された、グーグルの“猫論文”というものです。ニュースでも話題になりましたが、ここで用いられたのがディープラーニングです。猫論文とは次のようなものです。ユーチューブ1000万枚の画像を1000台のパソコンに3日間、見続けさせた結果、機械が猫や人の顔を認識する仕組みを自ら獲得するようになった――。
グーグルの“猫論文”は、どこが、とてつもなくすごいのでしょうか。1000台のパソコンに1000万枚の画像を見せて、「これが猫の顔です」なんて、これまでの人工知能レベルでもできるだろうと、みなさんは思っていませんか。しかし決定的に違うのは、これまでは、「これが猫の顔の特徴です」という答えを人間があらかじめ与えていたんです。その特徴量を与えてやれば、なるほどニューロンの仕組みを使って機械は猫の判定をします。でもこの猫論文はそうじゃない。
例えて言えば、これまでのはみなさんが問題集を解く作業に似ています。答えを教師は知っていて、最初から与えられている。これを教師あり学習と言います。それに対してディープラーニングは、答えは与えられていないんです。最初から猫の顔の特徴はこうだということは一切!教えず、ただひたすら画像を見せていく。その中から、猫という存在を見つけ出したということが、とてつもなくすごいことなんです。
これからの人工知能に人からの教育は要らなくなるでしょう。それに代わって、無数の情報の中から、その意味とか概念を、機械そのものが見つけ出す。言葉では簡単に言いましたけど、それはものすごく難しいことなんです。人間の教育なしに機械が自ら大量のデータを収集し、自律的に考え、猫・人の顔を認識した。それによってディープラーニングは、この1年、空前の第3次人工知能ブームを巻き起こしたのです。