不正アクセス対策や、個人情報の保護、マルウェア対策など、セキュリティとして一般に言われる、「情報セキュリティ、いわばコンピュータセキュリティ」研究は多岐にわたり、昨今その重要性はますます高まっています。江村先生の研究分野はその最も中核の暗号理論。今の旬の課題は、難しい暗号でがっちりと個人の情報が漏れないようにデータを保護しすぎるとうまくデータを活用することができない、うまく活用したいけど個人の情報は漏れないようにデータは守らなければいけない、ということ。そんなジレンマを解決してくれる「ちょうどいい」暗号を用い、個人情報を守る、「暗号化したままで集計する方法」を切り拓こうとしています。
複数の銀行が管理する個人情報付きのデータ。一つのデータベースで集計させるには?
セキュリティと聞くと、監視カメラ、金庫、コンピュータウィルス対策など、いろいろと思い浮かぶものがあるかと思いますが、私が研究しているのは暗号理論です。ネットで買い物をするときなど、クレジットカードが暗号化されているおかげで、私たちの個人情報が守られています。
暗号というと何となく安全そうな印象を受けるかと思いますが、そもそも安全な暗号とはどのようなものでしょうか。実際は数学的に厳密に定義されますが、直観的には暗号文を見てもその内容が分からなければ安全な暗号と言えるでしょう。さらに強い安全性として、暗号文から別の暗号文を作成できない「CCA(Chosen Ciphertext Attack 選択暗号文攻撃)」安全性が知られています。CCA安全性は世界的にも標準的な安全性として認識されており、実際日本でも電子政府推奨暗号としてCCA安全な暗号が選定されています。
では常にCCA安全な暗号を使用すればいいのでしょうか。実は強すぎる安全性にはデータ活用を妨げるという問題もあるのです。その例として、暗号化したまま計算を行うことができる準同型暗号を紹介します。
多くの金融機関や医療機関では個人情報を含んだ多くのデータを管理しており、これらは外に出すことは禁止されています。一方で、仮にデータを持ち寄ることが可能であるとしましょう。その膨大な集約データに対してあるパターンや相関関係などを導き出す「データマイニング」(データを掘り出すという意味)を行うことで、今後の経済発展や新規治療技術の開発等に繋がる可能性があります。
しかしデータをそのままサーバに集約して計算する際、サーバに個人情報が漏れてしまいます。そこで準同型暗号を用いることで、暗号化したままデータマイニングを行うことができます。例えば複数の銀行が、それぞれの取引データをまず暗号化してサーバに送り、サーバは暗号文から「統計値の暗号文」を作成することで、データの中身を知ることなく集計が可能となります。集約データを扱うことで、個々の銀行では見つけられなかった新たな知見が得られるようになるかもしれません。
では安全な準同型暗号とはどういうものでしょうか。もちろん暗号文からデータが漏れないことは必須ですが、データの暗号文から統計値の暗号文を作成できる必要があり、これはCCA安全性に矛盾します。つまりCCA安全性という強い安全性は、暗号化したままデータを活用するという目的に対しては邪魔をしているということになります。すなわち用途にあった「ちょうどいい」安全性を、場合によっては「弱い」安全性を選択する必要があるといえるでしょう。
準同型暗号以外にも、様々な機能を実現するために「ちょうどいい」安全性とは何か、またそのような暗号を実現するにはどうすればよいかについて、研究を行っています。
◆研究内容に関連してどのような知見、知識が必要でしょうか。
私が専門とする暗号理論とその応用研究では、実現したい機能に応じて適切な安全性を定義するとともに、暗号方式がその安全性を満たすことを数学的に証明する必要があります。 この「証明可能安全性」を与えるためには、代数学、確率統計学、情報理論、データ構造など多岐にわたる知識が必要となります。最近では暗号化したまま機械学習を行う研究も盛んに行われており、一口に暗号理論と言っても様々な分野を横断した知見を有することが必要となります。
◆どのように研究を行っていますか。
基本的には論文を読み、その中で面白いと感じるアイディアがあればそれを論文化するという方法で研究を進めています。その際、同僚や共同研究者にアイディアを聞いて議論を行うことや、自分が足りない知見を加えてもらうこともあります。逆に、他の研究者の相談に乗ることもあります。