- 2021/10/26 掲載
NTTテクノクロス、匿名加工情報作成ソフトウェアの新バージョンを販売開始
■背景
昨今、国内DX(デジタルトランスフォーメーション)が加速し、データ利活用が注目されています。その中で、パーソナルデータ(*1)から特定の個人を識別できないように加工した匿名加工情報(*2)は、個人情報保護法や次世代医療基盤法(*3)などの関連する法整備と共に利活用が拡大しています。政府機関の個人情報保護委員会は、匿名加工情報の作成・提供に関する公表を行っている事業者が現在500社に上るとしています(*4)。
しかし、匿名加工情報の作成では、元のパーソナルデータの数が少ない場合にはデータの匿名性か有用性のどちらかが低下するという課題があったり、緻密な分析を行う際にはデータの有用性の観点から匿名加工情報よりも実際のパーソナルデータが活用されたりするのが現状です。NTTテクノクロスは、より高度なデータ利活用を実現するため、パーソナルデータの匿名性を維持したまま分析の精度や範囲を高めることを可能にしました。
■特長
(1)データとしての有用性を維持した架空のパーソナルデータを合成
「tasokarena」新バージョンでは、元のパーソナルデータから特徴量や統計量・分布などが類似するデータを生成し、「実在しないが具体的なパーソナルデータ(合成データ)」を作り上げます。この合成データ生成機能は、匿名性やプライバシーを守りつつ、分析に必要な元のデータの性質を保持したデータを生成するため、従来の匿名加工情報作成ソフトウェアによるパーソナルデータの一般化(*5)や削除、ランダム化されたデータと比べて、より緻密なデータ分析が可能です。また、少ないデータから匿名化された大量の合成データを生成できるため、膨大なデータを必要とするAIの学習や訓練などに活用できます。
(2)NTT研究所の合成データ生成技術(特許技術)を活用
NTT社会情報研究所の特許技術である合成データ生成技術を活用しています。各属性の平均など統計値が元データとほぼ等しい合成データを生成する技術等を独自に開発し、これまでプライバシー保護技術では実現できなかった、分析に必要な複数の統計値を保持する多属性の合成データを生成することが可能になりました。NTT社会情報研究所は本技術の開発で培った知見を活用し、AI・機械学習分野における難関国際会議の匿名化技術を競うコンペティションで優勝(*6)しました。
*1:パーソナルデータ:特定の個人を識別することができるかを問わず、個人に関する情報全体を指します。
*2:匿名加工情報:2017年5月施行の改正個人情報保護法により、個人情報を「匿名加工情報」に加工し一定の条件を満たすことで、本人の同意なく柔軟な利活用が可能になりました。「匿名加工情報」とは、特定の個人を識別することができないように加工して得られる個人に関する情報であり、当該個人情報を復元して特定の個人を再識別することができないようにしたものです。
*3:次世代医療基盤法:2018年5月に施行され、認定事業者が複数の医療機関から患者情報の提供を受け、データを匿名加工した上で研究機関や企業に提供することが可能になりました。
*4:出典 パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書(個人情報保護委員会)(https://www.ppc.go.jp/files/pdf/personal_date_report2019_1.pdf)
*5:パーソナルデータの一般化:2018年5月に施行され、認定事業者が複数の医療機関から患者情報の提供を受け、データを匿名加工した上で研究機関や企業に提供することが可能になりました。
*6:出典 日本電信電話株式会社の発表資料(https://www.ntt.co.jp/news2021/2103/210302b.html)
関連コンテンツ
PR
PR
PR