- 会員限定
- 2020/12/21 掲載
「ヘビーウェイト・オントロジー」「ライトウェイト・オントロジー」をやさしく解説
合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー(翔泳社)』『図解これだけは知っておきたいAIビジネス入門(成美堂)』、執筆協力『マンガでわかる人工知能(池田書店)』など。
「ヘビーウェイト・オントロジー」とは
私たちがデータを分類したり分析したりする際、代わりにデータを処理してくれるコンピューターですが、コンピューターにも取り扱えるデータとそうでないデータがあります。このうち、コンピューターが取り扱いやすい形に置き換えられたデータを「構造化データ」と呼びます。人工知能(AI)の場合も同じで、読み込む情報が取り扱いやすい形になっていることが重要であり、かつ有効な分析結果を得るためには、AIに読み込んでもらう情報はなるべく正しく正確なことが望ましいのです。こうした点を踏まえると、最も正確に構造化データを作る方法は、人の手で情報を入力していくという方法になります。
たとえば、医療なら医療、経済なら経済の専門家といったように、各分野の専門家にデータを入力してもらい構造化データを作ることができれば、エキスパートシステムなどの知識を扱うAIは十分な能力を発揮することになるでしょう。
特に、知識表現などのオントロジー技術を用いたアプローチであれば情報同士の関連性を正しく把握できるようになるため、断片的な情報から知識のネットワークを辿り、価値ある情報にたどり着く「推論」が可能になります。また、専門家ほどではなくとも、一般人が持っている当たり前の感覚、つまり「常識」に関する構造化データを作ることができれば、AIはその常識を踏まえた判断ができるようになるはずです。
こうした考えから、1984年に一般常識をデータ化しAIに教えようとする「Cyc(サイク)プロジェクト」が始まりました。一般常識をデータベース化し、人間と同等のレベルのシステムを構築することを目的とした同プロジェクトは、2020年時点の現在も続いています。
このように、人間が持つ知識の概念を正しくAIに教えようとするアプローチは、「ヘビーウェイト・オントロジー」と言います。
しかし、このアプローチでは、新しい知識が増えたら情報を更新し、誤りが見つかれば修正するなど、その都度人手による調整が必要になります。そのため、この方法は特定の専門領域であったり、情報の変化が少ない分野であったりすれば良いのですが、情報の変化が激しい分野では使えません。それは一般常識についても同じです。そこで、別のアプローチが検討されるようになりました。
「ライトウェイト・オントロジー」とは
AIに学習させるデータを人手で入力していく、という方法が困難なのであれば、AI自らが情報を理解できるようにさせるアプローチがあります。これは、「ライトウェイト・オントロジー」と呼ばれるもので、AIが自分で情報間の関係性を見つけるというアプローチです。AIが知識の概念を自ら記述できるのであれば、人間の関与は必要ありません。具体的に言えば、AIが今まで扱えなかった非構造データを人間の手を借りずに構造化データにするための試みです。
SNSの書き込みや、使っているタグ、ブログ記事のアクセス傾向、検索エンジンの履歴や画像・動画のタグなど、ウェブ上のあらゆる情報には何らかの関連性があります。無関係なものもあれば、有意義な関係性もあるでしょう。
ライトウェイト・オントロジーのアプローチの場合、無数の関係の中から有意義な関係性を見つけ出します。しかし、人間とまったく違うプロセスで概念を獲得する方法のため、同じ物事に関する知識でも、AIと人間とでは違うものになりえます。同じ「猫」でも、捉え方は人間とAIで大きく異なる可能性があるということです。
ただ、間違った部分や大きく異なる部分だけを修正し、それ以外については勝手に知識を獲得してくれるのであれば非常に有用です。特に近年は機械学習技術が向上しており、機械学習によってライトウェイト・オントロジーの手法も大きく向上しました。Cycプロジェクトにもこうしたアプローチが取り入られるようになって、ようやくプロジェクトの終わりが見えてくるようになりました。
このオントロジーは技術というよりも「手法」についての話であり、実際にはさまざまな手法が組み合わせて使われています。どちらかにきれいに分けられるものではありません。
特に近年の機械学習やデータマイニング技術の向上により、ライトウェイト・オントロジーの精度は大きく向上しました。
正確なヘビィウェイト・オントロジーの手法も使いつつ、機械が学び、さらに精度を向上させて行きます。将来的には機械自ら構造化データを作れるようになるはずですが、それにはもう少し時間がかかりそうです。
今すぐビジネス+IT会員にご登録ください。
すべて無料!ビジネスやITに役立つメリット満載!
-
ここでしか見られない
1万本超のオリジナル記事が無料で閲覧可能
-
多角的にニュース理解
各界の専門家がコメンテーターとして活躍中!
-
スグ役立つ会員特典
資料、デモ動画などを無料で閲覧可能!セミナーにご招待
-
レコメンド機能
あなたに合わせた記事表示!メールマガジンで新着通知
関連コンテンツ
関連タグ
PR
PR
PR