- 会員限定
- 2018/11/28 掲載
AI活用のクラウド戦略、機械学習の基盤はIaaSかPaaSか? それともオンプレか
AIの利用機運は盛り上がるも現実は…
この恩恵に預かるべく、企業の大多数がAI活用に意欲を示している。ガートナーによると、AI市場は2015~17年の間に500%も成長すると見込まれている。さらにAI活用のプラットフォームは、大量データを扱う基盤整備の容易さから、約80%の企業がクラウドを利用すると予測している。
ただし、現状に目を転じるとまったく違う姿が浮き上がる。それは、AIを活用している企業は4%に過ぎず、ほとんどの企業は計画段階でストップしているという。
理由は「スキル不足」を筆頭に、「どのような戦略を立案すべきか分からない」「ユースケースの特定が困難」「資金調達(資金不足)」「インフラ統合が複雑」などが続く。つまり、現状においては、大多数がAIの活用に困っているということである。
分析環境はデータの近くに配備
では、AI活用はどのように進めるべきなのか。デカテ氏は「最初に考えたいのが、どのような手法で環境を整備すべきか」だと語る。そもそもAI自体が難解な分析モデルを用いる非常に複雑なシステムだ。また、AIの学習や分析モデルを構築するためのデータは、サイロ化された環境で分散管理されているケースがほとんどだ。こうした多様なデータを、どのように集約するかも難しい問題となる。
さらにAIの実装法も、その前段階である分析モデルの策定から、適切なデータ抽出、データによるモデルのトレーニングと検証までの新たなスキル習得が伴う複雑な作業をカバーしなければならない。これでは答えが簡単に出ないのは当然だ。
デカテ氏は「データにまつわる問題解決のために私が推奨するのは、極めてシンプルなアプローチだ。データのやりとりの負荷を抑えるために、分析環境のできる限り“近くに”分析用データを配備するのだ」と説明する。
「ITインフラは企業ごとに異なる。画一的な推奨モデルは存在しないが、最終的なデータの置き場所は、オンプレでもクラウドでも、アプリケーションの中でも構わない。実際に、Netflixはクラウドに、独シーメンスや米ゼネラル・エレクトリック(GE)はオンプレ環境にそれぞれAI活用のためのデータを置いている」(デカテ氏)
また、データの分析場所については、処理の中身を踏まえた見極めが肝要だ。クラスタリングやランダム・ツリーなどを用いる一般的な機械学習の統計分析と、画像解析などでのディープラーニングによる分析では用意すべき環境が大きく異なる。特に後者は、大量計算のためにGPU (Graphics Processing Unit)が欠かせず、専用ハードや複雑なシステム構成のために、整備コストは高額となる。また、ソフトウェアを分析フレームワークに適合させるための作業がいくつも発生する。
自社のリソースを踏まえてクラウドを使い分ける
デカテ氏は「これらのことから、特にディープラーニングを考えるのなら、リスクを抑えるために、PoC(概念実証)から始めるべきだろう。環境整備の間にGPUテストの時間を稼げるメリットもある。これらの作業は複雑で、ユーザー部門では判断できないことも多いため、プロジェクトはIT部門が主導する必要がある」と指摘する。一方で、AI分析の環境整備においては、実現すべき環境が複雑なだけにクラウドの使い方にも知恵を絞る必要がある。グーグルやAWS、マイクロソフトなどの大手ベンダーはいずれもAI機能をIaaS(Infrastructure as a Service)やPaaS(Platform as a Service)、SaaS(Software as a Service)として提供している。
たとえば、高スキルの技術者はいるが、データサイエンティストが不在で分析モデルを設計できなかったり、インフラ専門家がおらずGPUを扱えなかったりといった場合には、Microsoft AzureでPaaSとして提供されている「Cognitive API」が足りないスキルを補うはずだ。デカテ氏は、「エコシステムのためのリソースが十分というのならIaaSで最適化を目指してほしい。データサイエンティストしかいないのなら、下図のようにモデルとデータ統合のカスタマイズでSaaSが力を発揮する」と説明する。
【次ページ】IaaSとPaaSのどちらを選ぶべきか?
関連コンテンツ
関連コンテンツ
PR
PR
PR