• 会員限定
  • 2020/12/21 掲載

「ヘビーウェイト・オントロジー」「ライトウェイト・オントロジー」をやさしく解説

連載:図でわかる3分間AIキソ講座

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
人工知能(AI)を活用した分析の目的の1つに、膨大な情報の中から、人間が見つけ出すことのできない「価値ある情報を見つける」ことが挙げられます。そうした価値ある情報を見つけ出すためには、ある程度整理された「構造化データ」を準備し、AIに学ばせる必要があります。今回は、この構造化データを準備するオントロジー(情報理論)手法のうち、「ヘビーウェイト・オントロジー」「ライトウェイト・オントロジー」をやさしく解説します。
執筆:フリーライター 三津村直貴

執筆:フリーライター 三津村直貴

合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー(翔泳社)』『図解これだけは知っておきたいAIビジネス入門(成美堂)』、執筆協力『マンガでわかる人工知能(池田書店)』など。

画像
AIが知識を得るためのオントロジー的アプローチは2種類に分かれます(後ほど詳しく解説します)


「ヘビーウェイト・オントロジー」とは

 私たちがデータを分類したり分析したりする際、代わりにデータを処理してくれるコンピューターですが、コンピューターにも取り扱えるデータとそうでないデータがあります。このうち、コンピューターが取り扱いやすい形に置き換えられたデータを「構造化データ」と呼びます。

 人工知能(AI)の場合も同じで、読み込む情報が取り扱いやすい形になっていることが重要であり、かつ有効な分析結果を得るためには、AIに読み込んでもらう情報はなるべく正しく正確なことが望ましいのです。こうした点を踏まえると、最も正確に構造化データを作る方法は、人の手で情報を入力していくという方法になります。

 たとえば、医療なら医療、経済なら経済の専門家といったように、各分野の専門家にデータを入力してもらい構造化データを作ることができれば、エキスパートシステムなどの知識を扱うAIは十分な能力を発揮することになるでしょう。

 特に、知識表現などのオントロジー技術を用いたアプローチであれば情報同士の関連性を正しく把握できるようになるため、断片的な情報から知識のネットワークを辿り、価値ある情報にたどり着く「推論」が可能になります。また、専門家ほどではなくとも、一般人が持っている当たり前の感覚、つまり「常識」に関する構造化データを作ることができれば、AIはその常識を踏まえた判断ができるようになるはずです。

 こうした考えから、1984年に一般常識をデータ化しAIに教えようとする「Cyc(サイク)プロジェクト」が始まりました。一般常識をデータベース化し、人間と同等のレベルのシステムを構築することを目的とした同プロジェクトは、2020年時点の現在も続いています。

 このように、人間が持つ知識の概念を正しくAIに教えようとするアプローチは、「ヘビーウェイト・オントロジー」と言います。

 しかし、このアプローチでは、新しい知識が増えたら情報を更新し、誤りが見つかれば修正するなど、その都度人手による調整が必要になります。そのため、この方法は特定の専門領域であったり、情報の変化が少ない分野であったりすれば良いのですが、情報の変化が激しい分野では使えません。それは一般常識についても同じです。そこで、別のアプローチが検討されるようになりました。

「ライトウェイト・オントロジー」とは

 AIに学習させるデータを人手で入力していく、という方法が困難なのであれば、AI自らが情報を理解できるようにさせるアプローチがあります。

 これは、「ライトウェイト・オントロジー」と呼ばれるもので、AIが自分で情報間の関係性を見つけるというアプローチです。AIが知識の概念を自ら記述できるのであれば、人間の関与は必要ありません。具体的に言えば、AIが今まで扱えなかった非構造データを人間の手を借りずに構造化データにするための試みです。

画像
AIが知識を得るためのオントロジー的アプローチの2つ目

 SNSの書き込みや、使っているタグ、ブログ記事のアクセス傾向、検索エンジンの履歴や画像・動画のタグなど、ウェブ上のあらゆる情報には何らかの関連性があります。無関係なものもあれば、有意義な関係性もあるでしょう。

 ライトウェイト・オントロジーのアプローチの場合、無数の関係の中から有意義な関係性を見つけ出します。しかし、人間とまったく違うプロセスで概念を獲得する方法のため、同じ物事に関する知識でも、AIと人間とでは違うものになりえます。同じ「猫」でも、捉え方は人間とAIで大きく異なる可能性があるということです。

 ただ、間違った部分や大きく異なる部分だけを修正し、それ以外については勝手に知識を獲得してくれるのであれば非常に有用です。特に近年は機械学習技術が向上しており、機械学習によってライトウェイト・オントロジーの手法も大きく向上しました。Cycプロジェクトにもこうしたアプローチが取り入られるようになって、ようやくプロジェクトの終わりが見えてくるようになりました。

 このオントロジーは技術というよりも「手法」についての話であり、実際にはさまざまな手法が組み合わせて使われています。どちらかにきれいに分けられるものではありません。

 特に近年の機械学習やデータマイニング技術の向上により、ライトウェイト・オントロジーの精度は大きく向上しました。

 正確なヘビィウェイト・オントロジーの手法も使いつつ、機械が学び、さらに精度を向上させて行きます。将来的には機械自ら構造化データを作れるようになるはずですが、それにはもう少し時間がかかりそうです。

この続きは会員限定(完全無料)です

ここから先は「ビジネス+IT」会員に登録された方のみ、ご覧いただけます。

今すぐビジネス+IT会員にご登録ください。

すべて無料!ビジネスやITに役立つメリット満載!

  • ここでしか見られない

    1万本超のオリジナル記事が無料で閲覧可能

  • 多角的にニュース理解

    各界の専門家がコメンテーターとして活躍中!

  • スグ役立つ会員特典

    資料、デモ動画などを無料で閲覧可能!セミナーにご招待

  • レコメンド機能

    ​あなたに合わせた記事表示!メールマガジンで新着通知

関連タグ

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます