ソフトコンピューティング

膨大なデータから価値ある情報を掘り出し、解析~ラフ集合とデータマイニングに関する研究


酒井浩 先生

九州工業大学 工学部 電気電子工学科/工学府 工学専攻

どんなことを研究していますか?

インターネットである商品を検索していたら、関連商品まで表示されることがよくあります。この機能の多くは、相関ルール「この商品を買った人はこちらの商品も買っている」の利用等により実現され、一般にリコメンデーションシステムと呼ばれています。データマイニングにより得られた相関ルールを活用する具体例です。

私は、データマイニングの技法を使うデータ解析を研究しています。データマイニングとは、データベースに蓄積された膨大なデータの中から価値のある情報を掘り出す(mine掘る)作業のことです。人間が暗黙のうちに行ってきた「過去の状況を把握し、今後の活動に反映する」という、ごく普通な行動は、「蓄積されたデータから有益なルールを取り出し、それらを意思決定に用いる」と具体化できると考えます。この研究分野の発展は、人間の知的活動を支援することに繋がると考えます。

数値以外のデータも分析

image

私が研究対象としている手法は、ラフ集合(LaughではなくRough、笑う集合ではなく粗い集合)と呼ばれ、約35年前にポーランドの数理論理学者パブラック(Pawlak)教授によって提案されたデータ解析法です。数値データに対して平均や分散を活用する統計的解析は既に確立していますが、数値以外のデータには平均や分散を定義できない場合(例えば、名前のデータにおける平均、血液型の平均は?)もあります。ラフ集合理論では、このようなデータから効率よく相関ルールを抽出する手法を扱い、得られた相関ルールはデータの特徴把握、自動診断、意思決定支援など、多様な知的活動に利用されています。

image

学生と。右端が酒井先生

学生はどんなところに就職?

一般的な傾向は?
  • ●主な業種は→IT系、電気メーカー、データ解析系
  • ●主な職種は→プログラマ、システムアナリスト
分野はどう活かされる?

IT系企業や電気メーカーの業務に活かされています。

先生から、ひとこと

データサイエンティストやAI技術者を目指す皆さんは、数学、特に統計学や数理論理学と、情報、IT技術、プログラミング等をしっかり勉強してください。

先生の学部・学科はどんなとこ

九州工業大学は社会からの工学的技術開発・応用への要請に応えるために、時代に即した学科体系を構成し、各教員はその時代が求める最先端の課題に取り組んでいます。

image

人工知能に関する国際会議(2018年、中国重慶市)にて基調講演する酒井先生

先生の研究に挑戦しよう

成績上位者、成績下位者の学習に関するアンケートデータがあれば、成績上位者を特徴付ける学習の相関ルール、成績下位者を特徴付ける学習の相関ルールを作れるかもしれません。成績上位者の特徴を真似することで、自身の学習の改善点を確認できると考えます。

データがあれば相関ルールを生成でき、得られた相関ルールは今後の活動方針の根拠になります。このような観点からデータ解析の重要性が今まで以上に増していると考えます。

データを得ることは容易なことではないですが、研究者のために機械学習レポジトリ(https://archive.ics.uci.edu/ml/index.php)が用意されています。これは、データを集めたウェブページです。提案するデータ解析手法の妥当性を検証する際に、多くの研究者がこのページのデータを利用します。

本コーナーは、中高生と、大学での学問・研究活動との間の橋渡しになれるよう、経済産業省の大学・産学連携、および内閣府/科学技術・イノベーション推進事務局の調査事業の成果を利用し、学校法人河合塾により、企画・制作・運営されています。

みらいぶっくへ ようこそ ふとした本との出会いやあなたの関心から学問・大学をみつけるサイトです。
TOPページへ