• 2016/04/21 掲載

今さら聞けないディープラーニングの基本、機械学習とは何が違うのか

野村総合研究所 古明地正俊氏が解説

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
第三次人工知能(AI)ブームが、メディアなどでクローズアップされ始めたのは2011年頃から。その中心にあったのが、IBMのワトソンとディープラーニング(深層学習)と呼ばれる新技術だ。ワトソンは人工知能が商用で利用できることを世間に広め、一部機能が日本語化された。一方、ディープラーニングは、画像分野で精度を上げ、その応用としてグーグルの「AlphaGo」が囲碁の世界王者にも勝ち、大きな話題を振りまいた。人工知能とは一体何なのか。その基本とビジネス活用事例、最新動向、今後の展望について、野村総合研究所 上席研究員の古明地正俊氏が解説する。

本記事は、「第233回 NRIメディアフォーラム」の講演内容をもとにビジネス+IT編集部が再構成したものです。

第三次人工知能ブームの立役者は「ディープラーニング」

 かつて1980年代に人工知能ブームが起きたとき、日本では第五世代コンピュータのプロジェクトが展開され、主としてルールベースの人工知能が研究された。これは、プログラムでいうところの「if~then~eles」のように、専門家の知識をルールで記述して専門家と同様のことを行えるようにするという設計思想だった。しかし、専門家の知識を抽出するのは難しく、何よりもメンテナンスが大変だったため、実用には至らなかった。

画像
第三次AIブームの到来
(出典:野村総合研究所)


 一方、今回のブームのコアになる「機械学習」は、人がルールを記述することはない。たとえば、猫の画像認識では、猫というタグを画像に付け、機械学習アルゴリズムに流し込むと、自動的に猫を判断して分類してくれる。野村総合研究所 上席研究員の古明地正俊氏はその背景には大きく2つのポイントがあったと指摘する。

「1つめの背景がビッグデータ技術の進展だ。機械学習をさせるには、多くの学習データを用意しなければならない。これらを容易に入手できるようになった。もう1つの背景は、計算機の性能が飛躍的に上がったことがある。さらに“ディープラーニング(深層学習)”という新技術が登場した点も大きい」(古明地氏)

 ではディープラーニングと機械学習は何が違うのか。ディープラーニングは機械学習の一種とみなされるが、大きな違いもある。たとえば、従来型の機械学習で色を認識するには、「色情報」を特徴にして識別させていた。この特徴は、人間が定義する必要があった。

 一方、ディープラーニングでは、学習データからマシン側が自動的に特徴を抽出する点が大きく違う。つまり何に着目すればよいかを教える必要がなく、どんな特徴を利用すれば識別できるのかを自動的に学ぶ。

画像
従来の機械学習とディープラーニングの違い
(出典:野村総合研究所)


「複雑な画像識別では、特徴を抽出していくことが難しくなる。実際に人が、猫とライオンの子供を識別する特徴を知ることは難しい。ディープラーニングでは、非常に細かい部分まで特徴を抽出できるため、画像認識や音声認識の分野で幅広く活用されるようになった。ただし言語処理分野に関しては、まだ十分に使いこなされていないのが実情だ」(古明地氏)

画像
ディープラーニングが適用できる領域
(出典:野村総合研究所)


実用段階に入ったディープラーニング、ECサイトなどの具体的な事例

 では、ディープラーニングは現在、どのような分野で活用されているのか。その1つが、米国のスタートアップ、Sentient Technologiesの取り組みだ。ディープラーニングを商品検索に活用している。

画像
ディープラーニングを商品検索に活用した事例
(出典:野村総合研究所)


「ECサイトで商品を選ぶ際に、自分のイメージを伝えたいことがある。その際に、商品画像を自動的に分類し、ユーザーの好みにマッチするサンプル画像を提示し、選択しやすくしてくれる。特に服や靴の好みなど、言語による表現が難しいものに対して、非常に効果が高い」(古明地氏)

 画像処理と言語処理という2種類のディープラーニングを組み合わせた事例もある。これは、画像認識に良く利用されるニューラルネットの「CNN」(Convolutional Neural Network)で認識したあと、フィードバック経路を有するニューラルネットの「RNN」(Recurrent Neural Network)により、写真の説明文を自動生成するユニークな事例だ。特にRNNは、機械翻訳など自然言語処理の分野への適用が拡大している。

「この技術は、ソーシャルメディア系のサービスを提供する場合にとても便利だ。ユーザーの画像を自動的にタグ付けできるため、あとから言葉で検索が行えるようになる。サービス側の企業にとっても、画像から言語化された多くの情報を抽出することで、ユーザーに対する理解が深められるというメリットがある。たとえば、たびたびラーメンの画像をアップする人の情報を言語として抽出できれば、この人がラーメン好きだということが分かるだろう」(古明地氏)

画像
2種類のディープラーニングを活用して画像に対するキャプションを生成した事例
(出典:野村総合研究所)

ディープラーニングの技術と人材はどう確保すればよいか

 では、機械学習/ディープラーニングを利用した情報システムを、どのように開発すればよいのだろうか。機械学習を利用した情報システムは、アプリケーション、開発方法、開発者、技術・基盤など多くの点で、従来の情報システムとは異なる。そのためアプローチも変えていかなければならないと古明地氏は指摘する。

画像
機械学習を利用した情報システム構築の考え方の違い
(出典:野村総合研究所)


「機械学習を利用した開発では、学習プロセスを含めてPDCA型でまわし、学習データの調達環境も整える必要がある。また開発者の確保も重要だ。人工知能は大学での研究が盛んで、従来はあまり民間に人材が流れることがなかった。しかし、現在は海外でグーグルやフェイスブックなどのIT企業が人材の囲い込みを行っているおり、日本ではファナック、パナソニック、トヨタなどのメーカーがスタートアップと業務提携や共同研究を進めている」(古明地氏)

 開発ツールやプラットフォームに関しては、オープンソースが多く、導入自体は容易だ。とはいえ、使いこなしは難しく、早い段階での人材確保が重要だ。画像・音声分類など、限定された用途であれば、IBMの「Alchemy API」や、Alpacaの「Libellio」のようなサービスも活用できる。ただし、何か新しいタスクをつくり込んでディープラーニングを適用する場合にはあまり向いていない。

画像
ディープラーニング技術の獲得例
(出典:野村総合研究所)


「大きな変化として、ハードウェアやプラットフォームの性能が大幅に向上したこともトピックスだ。現在のディープラーニングの標準には、行列演算処理が得意なNVIDIAのグラフィック専用GPUが使われている。演算性能だけ比べれば、NVIDIAのGPUが8個あれば、地球シミュレータの演算性能と肩を並べられるほど。先日の囲碁対決では170~180台ぐらいのGPUボードが使われた。すなわち人間は、地球シミュレータの20倍ぐらいの演算性能のコンピュータと戦ったことになる」(古明地氏)

 もちろんGPUは地球シミュレータと同様に、膨大な電気が必要だ。そのため、性能の向上とともに小電力化も重要なテーマとなる。そこでFPGAなどを使い、ニューラルネットワークのアルゴリズムをチップ上に実装し、省電力と高速化を実現している。また量子コンピュータも注目されている。米国のベンチャー「D-Wave」や、情報先端研究プロジェクト活動を行う「IARPA」で戦略的投資が行われ、飛躍的な高速計算の実現を目指しているところだ。

画像
人工知能向けハードウェア
(出典:野村総合研究所)


自然言語対応の旅行コンシェエルジェや、単語の分散表現技術も登場

 ディープラーニングは今後どういう展開を見せていくのか。ディープラーニングには、依然として学習データの準備という課題がある。とはいえ音声や画像の処理については、人手をかけずに安価に実現できるため、ソリューションとして有望だ。中長期的には開発・運用コストが低下し、適用領域が拡大していく。長期的には自然言語処理にも対応できるようになり、ホワイトカラーの仕事に関して自動支援が行える可能性もある。

「今後の展開では、まず知識獲得が重要になるだろう。自然言語の理解がある程度できると、旅行予約が可能なコンシェエルジェサービスも実現する。実際に米国のHelloGbyeにより、すでに試験サービスが始まり、自然言語で飛行機チケットやホテルの予約などが簡単にできるようになった。ただし、旅行条件を把握し、エアラインや予約サイトの既存システムと上手くつなげないと、本当の意味では使いこなせない」(古明地氏)

画像
AI活用システムと既存システムの連携
(出典:野村総合研究所)


 この課題はECサイトでも同様だ。「赤いヒラヒラした可愛いドレスが欲しい」と言う質問に対し、前段の人工知能が理解しても、後段のECサイトのデータベース情報が整備されていなければ、商品を見つけ出せない。接続システムのオペレーションに関する知識を自動的に取得する必要がある。

「そこで固有表現(固有名詞)を自動抽出する技術がキーポイントになる。コンタクトセンターで人工知能を使う場合に、製品の問い合わせがあると、商品名を企業データベースから抽出し、未知の製品を取り扱えるようする必要がある。従来はこれを人手で対応していたが、自動化が行えれば、従来型の機械学習でも安価に利用できる」(古明地氏)

 米グーグルは、単語の分散表現を獲得できる“Word2Vec”という手法も提案している。これにより、たとえば「KING-MAN+WOMAN=QUEEN」といった演算が可能になる。ベクトル化した表現で単語を扱うと、単語間の演算に対応できるのだ。既知の単語から未知の単語(QUEEN)が導き出され、概念的に把握できるようになる。そうなると、企業のドキュメントを大量に読み込ませ、未知の製品名が出ても推測できるようになる。

「強化学習」で短時間に学習能力を高め、より賢くなっていく人工知能

 もう1つ、今後の展開では「教師なし学習」と呼ばれる、学習データが不要な「強化学習」が求められている。いま話題のGoogleのDeepMindが、碁の打ち手を検討する強化学習によって、普通の人では勝てないぐらいエージェントを賢くさせたことで有名になった。この手法は、環境から得られる状態から試行錯誤によって報酬(点数)が増大する方向に最適な行動を学習していくものだ。

「画像認識でのディープラーニングのように、学習データを事前に整備する必要がなく、ゲームをすればするほど賢くなっていく。この手法は昔からあったが、最近では強化学習の課題をディープラーニングで解けるようになったことが大きなポイントだ。自動的に学習するため、短時間で能力を高められる。最近ではロボット制御や自動走行など、シミュレーションベースの閉じられた世界で、短時間に学習効果を上げられるようになってきた」(古明地氏)

 古明地氏が示した今後の人工知能関連技術のロードドマップは以下の通り。

画像
AI関連技術のロードマップ
(出典:野村総合研究所)


「ディープラーニングは現在、ビジネス面では画像処理が注目されている。米国のスタートアップが、さまざまな使い方を模索しており、数年後に日本でも新しい使い方が登場してくると予想される。自然言語処理に関しては、単独ですぐの進展はないが、音声・画像の認識を組み合わせたアプリケーションも登場した。プラットフォームについも、GPU性能が高まり、ディープラーニング向けの機能が継続的に追加されていく。FPGAの利用も進み、これから性能もさらに向上していくだろう」(古明地氏)
関連記事

関連タグ

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます