インターネットである商品を検索していたら、関連商品まで表示されることがよくあります。この機能の多くは、相関ルール「この商品を買った人はこちらの商品も買っている」の利用等により実現され、一般にリコメンデーションシステムと呼ばれています。データマイニングにより得られた相関ルールを活用する具体例です。
私は、データマイニングの技法を使うデータ解析を研究しています。データマイニングとは、データベースに蓄積された膨大なデータの中から価値のある情報を掘り出す(mine掘る)作業のことです。人間が暗黙のうちに行ってきた「過去の状況を把握し、今後の活動に反映する」という、ごく普通な行動は、「蓄積されたデータから有益なルールを取り出し、それらを意思決定に用いる」と具体化できると考えます。この研究分野の発展は、人間の知的活動を支援することに繋がると考えます。
数値以外のデータも分析
私が研究対象としている手法は、ラフ集合(LaughではなくRough、笑う集合ではなく粗い集合)と呼ばれ、約35年前にポーランドの数理論理学者パブラック(Pawlak)教授によって提案されたデータ解析法です。数値データに対して平均や分散を活用する統計的解析は既に確立していますが、数値以外のデータには平均や分散を定義できない場合(例えば、名前のデータにおける平均、血液型の平均は?)もあります。ラフ集合理論では、このようなデータから効率よく相関ルールを抽出する手法を扱い、得られた相関ルールはデータの特徴把握、自動診断、意思決定支援など、多様な知的活動に利用されています。
一般的な傾向は?
- ●主な業種は→IT系、電気メーカー、データ解析系
- ●主な職種は→プログラマ、システムアナリスト
分野はどう活かされる?
IT系企業や電気メーカーの業務に活かされています。
データサイエンティストやAI技術者を目指す皆さんは、数学、特に統計学や数理論理学と、情報、IT技術、プログラミング等をしっかり勉強してください。