「美味しそう」と感じる人の視覚的感性を理解するAIを目指して
人の視覚情報処理
私達の生活において、視覚は非常に重要な役割を担っています。
人は、どこにどのような物体が存在するかを認識するだけでなく、紅葉や夜景を「美しい」と感じたり、料理の見た目からそれが「美味しそう」と感じたりできます。つまり、物体を単純に認識するだけでなく、より高次な感覚量を処理する視覚的感性が備わっています。
料理写真の魅力度を推定する技術
私の研究室では、視覚的感性を理解できる、より知的な人工知能技術を研究しています。
具体的な応用先として、1)自動車運転支援のために車載カメラ画像から道路標識等の視認性(ドライバからの見つけやすさ)を推定する技術や、2)レストランにおける料理メニューやSNSに載せる際の支援として料理写真の魅力度(美味しそうな度合い)を推定する技術に注目しています。
少量でも高品質なデータで深層学習
上述の人工知能技術を実現するために、人が視対象から受ける感覚量を数値化した上で、深層学習により視覚的感性をモデル化することを考えます。
ただし、深層学習では質・量を兼ね備えた学習データがなければ十分な性能を引き出せず、人の感覚量に関する大規模なデータセットを作成するのは困難です。そこで、少量ながら高品質なデータを拡張して大規模なデータセットを構築する工夫を取り入れています。
これにより、様々なシーンにおいて人の「感じ方」を高精度に予測する、人と同じ視覚的感性をもちあわせた人工知能の実現を目指します。
私は学生時代、車載カメラ画像からの物体の視認性推定技術に関する研究に取り組んでいました。所属研究室ではITS以外にも様々な応用研究に取り組んでいて、その一つが料理動画解析で、あるきっかけから自分もその研究に携わるようになりました。
そんな中、視認性推定は「人が見た際にどのように感じるか」を扱うものであり、同様の枠組みで「人が料理を見た際にどの程度美味しそうに感じるか」を予測できるのではないかと着想しました。自動車運転支援と料理支援という自身の独立した専門分野同士が繋がった瞬間でした。
「深層学習による視覚的感性数値化のための感性データ拡張手法」
◆ 道満研究室 HP
◆学んだことはどう生きる?
私の研究室では、画像処理や深層学習のためにPython言語を主に使用します。また、学科全体としてはC言語、C++言語、Java言語、Python言語の授業が開講されています。卒業後はそれらのスキルを活かしてシステム開発等に従事する学生が多い印象です。
画像処理や深層学習(機械学習)に関する技術を有する人材は現在様々な分野で重宝されていますので、この分野としては非常に強い追い風が吹いているといえます。
Q1.18才に戻ってもう一度大学に入るならば、学ぶ学問は? 情報学 |
|
Q2.日本以外の国で暮らすとしたらどこ? スウェーデン(国際会議出張で訪れた際に、気候もよく景色が綺麗で、いつか住みたいなと感じました) |
|
Q3.大学時代の部活・サークルは? バドミントン |
|
Q4.研究以外で、今一番楽しいこと、興味を持ってしていることは? 子育て |