LayerX 、プライバシー保護技術に関する共同研究をリクルートと実施
[22/03/29]
提供元:PRTIMES
提供元:PRTIMES
〜数学的に証明可能なプライバシー保証を提供する「差分プライバシー」を応用した研究成果を記事として公開〜
株式会社LayerXは、株式会社リクルートと共同で差分プライバシーのテキスト分析への応用に関する研究を実施しました。その成果の一端をブログ記事として公開したことをお知らせいたします。
[画像1: https://prtimes.jp/i/36528/122/resize/d36528-122-adc8cb0d1241012549f6-0.png ]
<背景>
LayerXではPrivacy Tech事業として、セキュリティ・プライバシー保護技術の研究開発を進めており、「Anonify」というブランド名のもとにモジュール/ソリューション化を目指しています。
昨今、個人のプライバシーへの関心の高まりや、GDPR違反による巨額の制裁金が課されることなどの背景から、データ分析に利用されるデータにも十分なプライバシー保護が求められるようになってきています。日本においても、令和2年 改正個人情報保護法が2022年4月1日に全面施行されます。具体的に改正法では、データ利活用に関する施策の在り方として仮名加工情報が創設されるなど※1、イノベーション促進のためデータを利活用することと個人のプライバシー配慮の両立が求められています。
しかしながら、「具体的にどのような処置を行えば、プライバシーを保護したことになると言えるのかよく分からない」という声も上がっています。
そのため、LayerXとリクルートは、プライバシーとして守るべき「要件」の学術的なデファクトスタンダードになっている「差分プライバシー」※2を共同研究対象として取り上げ、ユースケースに基づく実装を通じて、実際の分析を想定した適用例として整理しました。
<共同研究成果の概要>
テキスト分析というユースケースを例に、差分プライバシーを適用する実装を行いました。対象データとしては、株式会社リクルートが運営する旅行サイト『じゃらんnet』のクチコミデータを用いて、以下に示す2つのケースを想定したテキスト分析を行いました。
まず分析ケース1.として、記述統計への差分プライバシー適用を考えました。これは、positive・negative・neutralなクチコミそれぞれに対して、登場頻度が上位の単語の出現数を算出し、各単語の出現頻度に対して、差分プライバシー保護を実現するものです。
そして分析ケース2.では、機械学習アルゴリズムへの差分プライバシー適用を考えました。具体的には、positiveなクチコミを投稿したユーザは「リピートする」、negative・neutralなクチコミを投稿したユーザは「リピートしない」と仮定した上で、クチコミから「リピートする」「リピートしない」を予測する分類問題を解くものです。
[画像2: https://prtimes.jp/i/36528/122/resize/d36528-122-cbd675265dfd0d50de52-1.png ]
<共同研究成果の公開記事>
共同研究成果の一端を整理した記事を、リクルート アドバンスドテクノロジーラボのブログでご覧いただけます。
https://atl.recruit.co.jp/blog/5337/
記事においては、差分プライバシーについて、実際に利用されている事例を紹介した上で、その概要と定義についても簡単に述べています。上記のテキスト分析のケース(1.記述統計や、2.機械学習アルゴリズム)それぞれに対して、差分プライバシー技術を適用することによってプライバシー保護を図るイメージについて、実際のコードベースで紹介しています。
実際にテキストの分析業務を行われている方にも馴染み深いケースに対して差分プライバシーを適用する例を紹介しており、少しでも差分プライバシーを理解する助けになれば幸いです。
※1 仮名加工情報の創設について
令和2年 改正個人情報保護法において、「個人情報」と「匿名加工情報」の中間的に位置付けられる情報として、氏名等を削除することによって、他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工した個人に関する情報である「仮名加工情報」が設けられました。
仮名加工情報を利用する上では、過去に個人情報を取得した際の利用目的に縛られずに別目的でも利用できるなど規制が一部緩和される一方で、第三者提供は禁止され、事業者内部での利用が想定されている点がポイントとなっています。
※2 差分プライバシーについて
機密データに基づく統計データに、プライバシーを保護するノイズを注入することによって、統計的有用性を維持したまま、統計データにおける数学的に証明可能なプライバシー保証を提供するものです。
2006年に、Microsoft ResearchのDworkらによって、機密データに基づく統計データの公表に対して数学的に証明可能なプライバシー保証を提供するアプローチとして考案されました。2017年には、コンピュータサイエンス分野の最高峰である「ゲーデル賞」を受賞しています。
アメリカ合衆国国勢調査局は、2020年国勢調査において差分プライバシーを活用することによって、国民の匿名性を担保したまま、所得や学歴などの国勢調査結果を全世界に公表しています。
■ 「Anonify」について
データ利活用におけるプライバシー保護を実現するために、プライバシー保護技術や秘匿化技術、データの信頼性に関する研究・事業化を目指す、LayerX 3つ目の事業です。「Anonify」というブランド名のもとモジュール/ソリューション化を目指しています。
公式サイト:https://www.anonify.layerx.co.jp/
■ 株式会社LayerXについて
「すべての経済活動を、デジタル化する。」をミッションに、業務や生産をはじめとした経済活動の摩擦を解消し、この国の課題である生産性向上を実現するべく、様々な産業のDX(デジタルトランスフォーメーション)を推進しています。
[設立]2018年8月
[代表者名]代表取締役CEO 福島良典
[資本金]31億円(資本準備金含む)
[事業内容]「バクラク請求書」「バクラク申請」「バクラク電子帳簿保存」の提供(SaaS事業)、アセットマネジメントを扱う合弁会社の運営(Fintech事業)、プライバシーテックのR&Dと事業化(Privacy Tech事業)
[コーポレートサイト]https://layerx.co.jp/
■ LayerX 採用情報
LayerXは「すべての経済活動を、デジタル化する。」というミッションの元、信用や評価のあり方を変え、経済活動の摩擦を解消し、その恩恵を多くの企業や個人が受けられるような社会の実現に向けて採用活動を推進しています。
バクラク請求書の本提供開始に伴い、ソフトウェアエンジニアをはじめとしたあらゆる職種において採用活動を強化しています。ご興味をお持ちの方は以下よりエントリーをお待ちしています。
https://jobs.layerx.co.jp/
■ 本プレスリリースに関するお問合せ
pr@layerx.co.jp(担当:広報)
株式会社LayerXは、株式会社リクルートと共同で差分プライバシーのテキスト分析への応用に関する研究を実施しました。その成果の一端をブログ記事として公開したことをお知らせいたします。
[画像1: https://prtimes.jp/i/36528/122/resize/d36528-122-adc8cb0d1241012549f6-0.png ]
<背景>
LayerXではPrivacy Tech事業として、セキュリティ・プライバシー保護技術の研究開発を進めており、「Anonify」というブランド名のもとにモジュール/ソリューション化を目指しています。
昨今、個人のプライバシーへの関心の高まりや、GDPR違反による巨額の制裁金が課されることなどの背景から、データ分析に利用されるデータにも十分なプライバシー保護が求められるようになってきています。日本においても、令和2年 改正個人情報保護法が2022年4月1日に全面施行されます。具体的に改正法では、データ利活用に関する施策の在り方として仮名加工情報が創設されるなど※1、イノベーション促進のためデータを利活用することと個人のプライバシー配慮の両立が求められています。
しかしながら、「具体的にどのような処置を行えば、プライバシーを保護したことになると言えるのかよく分からない」という声も上がっています。
そのため、LayerXとリクルートは、プライバシーとして守るべき「要件」の学術的なデファクトスタンダードになっている「差分プライバシー」※2を共同研究対象として取り上げ、ユースケースに基づく実装を通じて、実際の分析を想定した適用例として整理しました。
<共同研究成果の概要>
テキスト分析というユースケースを例に、差分プライバシーを適用する実装を行いました。対象データとしては、株式会社リクルートが運営する旅行サイト『じゃらんnet』のクチコミデータを用いて、以下に示す2つのケースを想定したテキスト分析を行いました。
まず分析ケース1.として、記述統計への差分プライバシー適用を考えました。これは、positive・negative・neutralなクチコミそれぞれに対して、登場頻度が上位の単語の出現数を算出し、各単語の出現頻度に対して、差分プライバシー保護を実現するものです。
そして分析ケース2.では、機械学習アルゴリズムへの差分プライバシー適用を考えました。具体的には、positiveなクチコミを投稿したユーザは「リピートする」、negative・neutralなクチコミを投稿したユーザは「リピートしない」と仮定した上で、クチコミから「リピートする」「リピートしない」を予測する分類問題を解くものです。
[画像2: https://prtimes.jp/i/36528/122/resize/d36528-122-cbd675265dfd0d50de52-1.png ]
<共同研究成果の公開記事>
共同研究成果の一端を整理した記事を、リクルート アドバンスドテクノロジーラボのブログでご覧いただけます。
https://atl.recruit.co.jp/blog/5337/
記事においては、差分プライバシーについて、実際に利用されている事例を紹介した上で、その概要と定義についても簡単に述べています。上記のテキスト分析のケース(1.記述統計や、2.機械学習アルゴリズム)それぞれに対して、差分プライバシー技術を適用することによってプライバシー保護を図るイメージについて、実際のコードベースで紹介しています。
実際にテキストの分析業務を行われている方にも馴染み深いケースに対して差分プライバシーを適用する例を紹介しており、少しでも差分プライバシーを理解する助けになれば幸いです。
※1 仮名加工情報の創設について
令和2年 改正個人情報保護法において、「個人情報」と「匿名加工情報」の中間的に位置付けられる情報として、氏名等を削除することによって、他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工した個人に関する情報である「仮名加工情報」が設けられました。
仮名加工情報を利用する上では、過去に個人情報を取得した際の利用目的に縛られずに別目的でも利用できるなど規制が一部緩和される一方で、第三者提供は禁止され、事業者内部での利用が想定されている点がポイントとなっています。
※2 差分プライバシーについて
機密データに基づく統計データに、プライバシーを保護するノイズを注入することによって、統計的有用性を維持したまま、統計データにおける数学的に証明可能なプライバシー保証を提供するものです。
2006年に、Microsoft ResearchのDworkらによって、機密データに基づく統計データの公表に対して数学的に証明可能なプライバシー保証を提供するアプローチとして考案されました。2017年には、コンピュータサイエンス分野の最高峰である「ゲーデル賞」を受賞しています。
アメリカ合衆国国勢調査局は、2020年国勢調査において差分プライバシーを活用することによって、国民の匿名性を担保したまま、所得や学歴などの国勢調査結果を全世界に公表しています。
■ 「Anonify」について
データ利活用におけるプライバシー保護を実現するために、プライバシー保護技術や秘匿化技術、データの信頼性に関する研究・事業化を目指す、LayerX 3つ目の事業です。「Anonify」というブランド名のもとモジュール/ソリューション化を目指しています。
公式サイト:https://www.anonify.layerx.co.jp/
■ 株式会社LayerXについて
「すべての経済活動を、デジタル化する。」をミッションに、業務や生産をはじめとした経済活動の摩擦を解消し、この国の課題である生産性向上を実現するべく、様々な産業のDX(デジタルトランスフォーメーション)を推進しています。
[設立]2018年8月
[代表者名]代表取締役CEO 福島良典
[資本金]31億円(資本準備金含む)
[事業内容]「バクラク請求書」「バクラク申請」「バクラク電子帳簿保存」の提供(SaaS事業)、アセットマネジメントを扱う合弁会社の運営(Fintech事業)、プライバシーテックのR&Dと事業化(Privacy Tech事業)
[コーポレートサイト]https://layerx.co.jp/
■ LayerX 採用情報
LayerXは「すべての経済活動を、デジタル化する。」というミッションの元、信用や評価のあり方を変え、経済活動の摩擦を解消し、その恩恵を多くの企業や個人が受けられるような社会の実現に向けて採用活動を推進しています。
バクラク請求書の本提供開始に伴い、ソフトウェアエンジニアをはじめとしたあらゆる職種において採用活動を強化しています。ご興味をお持ちの方は以下よりエントリーをお待ちしています。
https://jobs.layerx.co.jp/
■ 本プレスリリースに関するお問合せ
pr@layerx.co.jp(担当:広報)