開閉ボタン
ユーザーメニュー
ユーザーメニューコンテンツ
ログイン

  • 会員限定
  • 2020/12/21

「ヘビーウェイト・オントロジー」「ライトウェイト・オントロジー」をやさしく解説

連載:図でわかる3分間AIキソ講座

人工知能(AI)を活用した分析の目的の1つに、膨大な情報の中から、人間が見つけ出すことのできない「価値ある情報を見つける」ことが挙げられます。そうした価値ある情報を見つけ出すためには、ある程度整理された「構造化データ」を準備し、AIに学ばせる必要があります。今回は、この構造化データを準備するオントロジー(情報理論)手法のうち、「ヘビーウェイト・オントロジー」「ライトウェイト・オントロジー」をやさしく解説します。

フリーライター 三津村直貴

フリーライター 三津村直貴

合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー(翔泳社)』『図解これだけは知っておきたいAIビジネス入門(成美堂)』、執筆協力『マンガでわかる人工知能(池田書店)』など。

画像
AIが知識を得るためのオントロジー的アプローチは2種類に分かれます(後ほど詳しく解説します)


「ヘビーウェイト・オントロジー」とは

 私たちがデータを分類したり分析したりする際、代わりにデータを処理してくれるコンピューターですが、コンピューターにも取り扱えるデータとそうでないデータがあります。このうち、コンピューターが取り扱いやすい形に置き換えられたデータを「構造化データ」と呼びます。

 人工知能(AI)の場合も同じで、読み込む情報が取り扱いやすい形になっていることが重要であり、かつ有効な分析結果を得るためには、AIに読み込んでもらう情報はなるべく正しく正確なことが望ましいのです。こうした点を踏まえると、最も正確に構造化データを作る方法は、人の手で情報を入力していくという方法になります。

 たとえば、医療なら医療、経済なら経済の専門家といったように、各分野の専門家にデータを入力してもらい構造化データを作ることができれば、エキスパートシステムなどの知識を扱うAIは十分な能力を発揮することになるでしょう。

 特に、知識表現などのオントロジー技術を用いたアプローチであれば情報同士の関連性を正しく把握できるようになるため、断片的な情報から知識のネットワークを辿り、価値ある情報にたどり着く「推論」が可能になります。また、専門家ほどではなくとも、一般人が持っている当たり前の感覚、つまり「常識」に関する構造化データを作ることができれば、AIはその常識を踏まえた判断ができるようになるはずです。

 こうした考えから、1984年に一般常識をデータ化しAIに教えようとする「Cyc(サイク)プロジェクト」が始まりました。一般常識をデータベース化し、人間と同等のレベルのシステムを構築することを目的とした同プロジェクトは、2020年時点の現在も続いています。

 このように、人間が持つ知識の概念を正しくAIに教えようとするアプローチは、「ヘビーウェイト・オントロジー」と言います。

 しかし、このアプローチでは、新しい知識が増えたら情報を更新し、誤りが見つかれば修正するなど、その都度人手による調整が必要になります。そのため、この方法は特定の専門領域であったり、情報の変化が少ない分野であったりすれば良いのですが、情報の変化が激しい分野では使えません。それは一般常識についても同じです。そこで、別のアプローチが検討されるようになりました。

「ライトウェイト・オントロジー」とは

 AIに学習させるデータを人手で入力していく、という方法が困難なのであれば、AI自らが情報を理解できるようにさせるアプローチがあります。

 これは、「ライトウェイト・オントロジー」と呼ばれるもので、AIが自分で情報間の関係性を見つけるというアプローチです。AIが知識の概念を自ら記述できるのであれば、人間の関与は必要ありません。具体的に言えば、AIが今まで扱えなかった非構造データを人間の手を借りずに構造化データにするための試みです。

画像
AIが知識を得るためのオントロジー的アプローチの2つ目

 SNSの書き込みや、使っているタグ、ブログ記事のアクセス傾向、検索エンジンの履歴や画像・動画のタグなど、ウェブ上のあらゆる情報には何らかの関連性があります。無関係なものもあれば、有意義な関係性もあるでしょう。

 ライトウェイト・オントロジーのアプローチの場合、無数の関係の中から有意義な関係性を見つけ出します。しかし、人間とまったく違うプロセスで概念を獲得する方法のため、同じ物事に関する知識でも、AIと人間とでは違うものになりえます。同じ「猫」でも、捉え方は人間とAIで大きく異なる可能性があるということです。

 ただ、間違った部分や大きく異なる部分だけを修正し、それ以外については勝手に知識を獲得してくれるのであれば非常に有用です。特に近年は機械学習技術が向上しており、機械学習によってライトウェイト・オントロジーの手法も大きく向上しました。Cycプロジェクトにもこうしたアプローチが取り入られるようになって、ようやくプロジェクトの終わりが見えてくるようになりました。

 このオントロジーは技術というよりも「手法」についての話であり、実際にはさまざまな手法が組み合わせて使われています。どちらかにきれいに分けられるものではありません。

 特に近年の機械学習やデータマイニング技術の向上により、ライトウェイト・オントロジーの精度は大きく向上しました。

 正確なヘビィウェイト・オントロジーの手法も使いつつ、機械が学び、さらに精度を向上させて行きます。将来的には機械自ら構造化データを作れるようになるはずですが、それにはもう少し時間がかかりそうです。

この続きは会員限定です

ここから先は「ビジネス+IT プレミアム会員」に登録の方(登録は無料)のみ、ご利用いただけます。

今すぐビジネス+IT会員にご登録ください。

すべて無料!ビジネスやITに役立つメリット満載!

  • 1

    インタビューから事例記事まで、ここでしか読めない1万本超の記事が無料で閲覧可能

  • 2

    導入事例資料や技術資料、デモ動画などを無料でダウンロード・閲覧可能

  • 3

    年間1,000本以上、会員限定のスペシャルセミナーにご招待

  • 4

    ビジネス+IT編集部が必読記事を、メールマガジンでお知らせ!

お勧め記事

AI・人工知能・機械学習 ジャンルのトピックス

AI・人工知能・機械学習 ジャンルのIT導入支援情報

ビジネス+IT 会員登録で、会員限定コンテンツやメルマガを購読可能、スペシャルセミナーにもご招待!