- 2021/06/01 掲載
NTT、因果関係に基づく公平・高精度な機械学習予測を実現
融資承認や人材採用など、人を対象とした意思決定を機械学習予測によって行う場合、単純に予測精度のみを優先する機械学習技術を適用すると、性別・人種・障がいなど、人間が持つセンシティブな特徴に関して不公平な予測を行う機械学習モデルになってしまう可能性があります。一方で、どのような予測が不公平かということは個々の応用によって異なり、例えば「体力を要する職種における人材採用なので、体力の不足を理由とした不採用は不公平でない」とする場合も考えられ、このような不公平さに関する事前知識を活用しなければ、体力が不足した人材を採用し、予測精度が下がってしまうことがあります。
本技術では、不公平さに関する事前知識を、特徴・予測結果間の因果関係を表す因果グラフ(※1)として表現し、これを活用することで公平かつ高精度な機械学習予測を行う技術を実現しました。また従来法ではデータが特定のモデルから生じている場合でなければ公平性を保証できないのに対して、提案手法では様々なデータを用いて、公平な予測を行うことができることを確認しました。
1.背景
近年のAI・機械学習技術の目覚ましい発展に伴い、銀行における融資承認・企業における人材採用・児童に対する虐待の検知など、人生に重大な影響を与える意思決定を機械学習予測によって行い、人的コストの低減や意思決定の効率化・高速化を目指す事例が増えつつあります。
このような人を対象とした予測において、単純に予測精度のみを優先する機械学習技術を適用すると、性別・人種・障がいなど、人間が持つセンシティブな特徴に関して不公平な予測を行う機械学習モデルになってしまう可能性があります。
一方で、どのような予測が不公平であるかということは、個々の応用事例において求められる要請によって異なることが多く、例えば「体力を要する職種における人材採用なので、体力の不足を理由とした不採用は不公平ではないと考えたい」というような要請も考えられます。このような要請を考慮しない従来技術を用いると、体力の不足した応募者を多く採用してしまい、効果的な意思決定を行うことができないという問題がありました。
このような問題を解決するために、公平性に関する社会的要請を、特徴・予測結果間の因果関係を表す因果グラフとして表現することで、予測精度を向上させる機械学習技術がいくつか提案されましたが、これらの従来技術は単純な関数形で表現できるようなデータを用いた場合にしか、予測の公平性を保証できないという問題がありました。
2.研究の成果
NTTコミュニケーション科学基礎研究所は、人が持つ特徴と予測結果の間の因果関係に基づいて公平・高精度な予測を行える機械学習技術を開発しました。本技術を実現するにあたり、まずは予測の不公平さの度合いを数値化することが必要でした。公平さは、どのような社会的状況でも同じように判断されるわけではありません。例えば、体力を要する職種における人材採用を考えるときに、体力の不足を理由として不採用にすることは不公平ではなく、むしろ、職務遂行に必要な体力のある応募者のみ採用したい、と採用する側は考えるでしょう。このように、不公平さは、それぞれの社会的状況がもたらす条件や考え方(社会的要請)に基づいて決まります。今回の成果では、このような社会的要請に基づいて予測の不公平さの度合いを数値的に測定するための尺度を新たに考案しました。この予測の不公平さについての尺度は、複雑なデータに対しても適用可能であるように構成しました。従来技術では、データが複雑になると予測の公平さを保証することができませんでしたが、今回、この尺度を導入することによって、複雑なデータに対しても、予測結果がその問題に対する社会的要請に沿って公平になるように制約を課しながら、機械に学習をさせることが可能になりました。結果として、様々に異なる状況での社会的要請に柔軟に対応でき、既存技術では複雑すぎて適用が難しかったデータも含め、公平かつ高精度な機械学習モデルを構築できるようになりました。さらに、本技術を用いることで、従来技術では公平性を保証できなかったデータにおいて公平性を保証し、かつ高精度な予測を行うことを、シミュレーション実験により確認しました。
(※1)因果グラフ
確率変数間の因果関係を矢印で表した図。本研究では、人が持つそれぞれの特徴と、人に対する予測結果を確率変数とみなし、その間の因果関係を表す図を考えている。
関連コンテンツ
PR
PR
PR