ディープラーニングの技術と人材はどう確保すればよいか
では、機械学習/ディープラーニングを利用した情報システムを、どのように開発すればよいのだろうか。機械学習を利用した情報システムは、アプリケーション、開発方法、開発者、技術・基盤など多くの点で、従来の情報システムとは異なる。そのためアプローチも変えていかなければならないと古明地氏は指摘する。
「機械学習を利用した開発では、学習プロセスを含めてPDCA型でまわし、学習データの調達環境も整える必要がある。また開発者の確保も重要だ。人工知能は大学での研究が盛んで、従来はあまり民間に人材が流れることがなかった。しかし、現在は海外でグーグルやフェイスブックなどのIT企業が人材の囲い込みを行っているおり、日本ではファナック、パナソニック、トヨタなどのメーカーがスタートアップと業務提携や共同研究を進めている」(古明地氏)
開発ツールやプラットフォームに関しては、オープンソースが多く、導入自体は容易だ。とはいえ、使いこなしは難しく、早い段階での人材確保が重要だ。画像・音声分類など、限定された用途であれば、IBMの「Alchemy API」や、Alpacaの「Libellio」のようなサービスも活用できる。ただし、何か新しいタスクをつくり込んでディープラーニングを適用する場合にはあまり向いていない。
「大きな変化として、ハードウェアやプラットフォームの性能が大幅に向上したこともトピックスだ。現在のディープラーニングの標準には、行列演算処理が得意なNVIDIAのグラフィック専用GPUが使われている。演算性能だけ比べれば、NVIDIAのGPUが8個あれば、地球シミュレータの演算性能と肩を並べられるほど。先日の囲碁対決では170~180台ぐらいのGPUボードが使われた。すなわち人間は、地球シミュレータの20倍ぐらいの演算性能のコンピュータと戦ったことになる」(古明地氏)
もちろんGPUは地球シミュレータと同様に、膨大な電気が必要だ。そのため、性能の向上とともに小電力化も重要なテーマとなる。そこでFPGAなどを使い、ニューラルネットワークのアルゴリズムをチップ上に実装し、省電力と高速化を実現している。また量子コンピュータも注目されている。米国のベンチャー「
D-Wave」や、情報先端研究プロジェクト活動を行う「
IARPA」で戦略的投資が行われ、飛躍的な高速計算の実現を目指しているところだ。
自然言語対応の旅行コンシェエルジェや、単語の分散表現技術も登場
ディープラーニングは今後どういう展開を見せていくのか。ディープラーニングには、依然として学習データの準備という課題がある。とはいえ音声や画像の処理については、人手をかけずに安価に実現できるため、ソリューションとして有望だ。中長期的には開発・運用コストが低下し、適用領域が拡大していく。長期的には自然言語処理にも対応できるようになり、ホワイトカラーの仕事に関して自動支援が行える可能性もある。
「今後の展開では、まず知識獲得が重要になるだろう。自然言語の理解がある程度できると、旅行予約が可能なコンシェエルジェサービスも実現する。実際に米国の
HelloGbyeにより、すでに試験サービスが始まり、自然言語で飛行機チケットやホテルの予約などが簡単にできるようになった。ただし、旅行条件を把握し、エアラインや予約サイトの既存システムと上手くつなげないと、本当の意味では使いこなせない」(古明地氏)
この課題はECサイトでも同様だ。「赤いヒラヒラした可愛いドレスが欲しい」と言う質問に対し、前段の人工知能が理解しても、後段のECサイトのデータベース情報が整備されていなければ、商品を見つけ出せない。接続システムのオペレーションに関する知識を自動的に取得する必要がある。
「そこで固有表現(固有名詞)を自動抽出する技術がキーポイントになる。コンタクトセンターで人工知能を使う場合に、製品の問い合わせがあると、商品名を企業データベースから抽出し、未知の製品を取り扱えるようする必要がある。従来はこれを人手で対応していたが、自動化が行えれば、従来型の機械学習でも安価に利用できる」(古明地氏)
米グーグルは、単語の分散表現を獲得できる“Word2Vec”という手法も提案している。これにより、たとえば「KING-MAN+WOMAN=QUEEN」といった演算が可能になる。ベクトル化した表現で単語を扱うと、単語間の演算に対応できるのだ。既知の単語から未知の単語(QUEEN)が導き出され、概念的に把握できるようになる。そうなると、企業のドキュメントを大量に読み込ませ、未知の製品名が出ても推測できるようになる。
「強化学習」で短時間に学習能力を高め、より賢くなっていく人工知能
もう1つ、今後の展開では「教師なし学習」と呼ばれる、学習データが不要な「強化学習」が求められている。いま話題のGoogleのDeepMindが、碁の打ち手を検討する強化学習によって、普通の人では勝てないぐらいエージェントを賢くさせたことで有名になった。この手法は、環境から得られる状態から試行錯誤によって報酬(点数)が増大する方向に最適な行動を学習していくものだ。
「画像認識でのディープラーニングのように、学習データを事前に整備する必要がなく、ゲームをすればするほど賢くなっていく。この手法は昔からあったが、最近では強化学習の課題をディープラーニングで解けるようになったことが大きなポイントだ。自動的に学習するため、短時間で能力を高められる。最近ではロボット制御や自動走行など、シミュレーションベースの閉じられた世界で、短時間に学習効果を上げられるようになってきた」(古明地氏)
古明地氏が示した今後の人工知能関連技術のロードドマップは以下の通り。
「ディープラーニングは現在、ビジネス面では画像処理が注目されている。米国のスタートアップが、さまざまな使い方を模索しており、数年後に日本でも新しい使い方が登場してくると予想される。自然言語処理に関しては、単独ですぐの進展はないが、音声・画像の認識を組み合わせたアプリケーションも登場した。プラットフォームについも、GPU性能が高まり、ディープラーニング向けの機能が継続的に追加されていく。FPGAの利用も進み、これから性能もさらに向上していくだろう」(古明地氏)