0
会員になると、いいね!でマイページに保存できます。
SIer各社がデータ活用人材の確保・育成を打ち出しています。その狙いは、お客さまが保有するデータから価値を見い出し、データ分析基盤などの構築(もしくはサービス提供)に帰着させることです。しかし現実的には、PoC(概念実証)でお客さまのデータの分析を代行することが、必ずしもITの仕事に帰着していません。今回は、SIer視点でのデータアナリティクスの難しさと対策を解説します。
組織によって異なる、データサイエンティストの役割
データサイエンティストは、所属組織によってその役割が異なります。1つ目は、WebサービスやECサイトの運営事業者やIoT機器の保守を担う企業など、社内にビッグデータの発生源となる自営のサービスを持つ組織のデータサイエンティストです。彼らは、自社のサービス価値を高めるための運用を担っています。
2つ目は、AI(人工知能)やデータ分析に関わる製品やサービスを提供する企業のデータサイエンティストです。彼らは、製品やサービスをお客さまが導入するためのプリセールスや、利用を促進するためのサポートを担っています。
3つ目は、SIerやコンサルティングファームのデータサイエンティストです。彼らは、実践的なデータ活用の知見をお客さま企業に提供する役割を担っており、市場全体の視点で見ると「お客さまの実地で獲得した専門性を汎化(はんか)して、他のお客さまに移転させる役割」と言えます。
ただし、コンサルティングファームがデータサイエンティストの人件費そのもので収益を上げる事業モデルなのに対し、SIerはお客さま企業の中に新たなデータ活用業務とそれを担う情報システムを構築する仕事に帰着させて収益を上げる事業モデルという違いがあります。
データサイエンティストの2つのタイプ
別の視点で見ると、データサイエンティストには「AIの実装技術者」と「統計解析手法によるデータ分析技術者」の2つのタイプがあります。端的に表現するならば、データを分析するのは前者ではAI、後者ではヒトです。
AIの実装技術者は、ニューラルネットワークの設計段階では目的に応じてCNN(畳み込みニューラルネットワーク)、RNN(再帰型ニューラルネットワーク)、LSTM(Long Short-Term Memory)などのモデルの枠組みを選択し、対象データに応じてチューニングします。データの前処理段階では、映像・画像・音声といったデータの種類に応じて、学習精度を高めるためのデータ加工や人工的生成を行います。モデル評価段階では、精度や性能の評価をもとに学習済みモデルを改善します。AIは学習済みモデルを元に、将来起こりうる事象の予測や未知のデータの判別を行います。
現在のAIの多くは、複雑なニューラルネットワークで汎用(はんよう)的に学習させますが、その代償としてモデルが人には解釈できない点と、予測や識別のあらゆるケースを網羅し、かつ正確な教師データが必要となる点が挙げられます。
一方、統計解析手法によるデータ分析技術者は、金融、製造、流通といった分野でそれぞれ確立されてきた数理モデルを駆使して分析を行います。ブラックボックスとなるAIとは異なり、結果が導き出される過程を人が解釈できる数式やグラフで表現できるので、納得感をもって業務上の問題解決に適用することができます。
近年、映像・画像・音声データの認識においてAI適用が進む一方で、数値やテキストのデータ分析においては、AIと統計解析手法が使い分けられています。AIの導入にはコストがかかるため、まずは統計解析手法によるコンパクトなモデルの導出を優先し、十分なデータが得られた時点でAIを導入する場合も多いようです。
SIer内のデータサイエンティストの役割
現在、H社は3000人、F社は1500人、N社は1000人など、SIer各社がデータ活用人材の確保・育成を打ち出しています。SIerは、データを保有するお客さまと分析技術を保有する自社の連携により、データの価値を競争力に転化して新たな事業を創出することを理想としています。しかし、現実にはデータの価値を収益化するのはなかなか困難であり、多くの場合はお客さまの中にデータを活用する業務を作り出し、それを実現するシステムの構築、つまり従来のSIの仕事に帰着している現状があります。たとえば、データ分析基盤やデータ分析の結果を業務に活かすシステムの構築などです。
それでも、従来はお客さまへのヒアリングを起点に「機能」で要件を定義して問題解決につなげてきたのに対して、お客さまの業務・運用で日々蓄積される「データ」を起点に問題解決につなげる試みは、新たなSIのアプローチではあります。
その中で、前述のAIの実装技術者は、学習済みAIモデルをお客さまに提供するという点で成果物(お客さまへの納入物)がはっきりしており、旧来のSIビジネスの枠組みで考えることができます。彼らは、今後発生するデータの分析を自動化する仕組みを構築します。ビッグデータを扱うことが前提となるため、周辺の社内システムと連携する大規模なデータ活用基盤の構築の仕事にもつながりやすいといえます。
一方で、統計解析手法によるデータ分析技術者は、現場の実務やデータに精通したお客さまと緻密に連携し、対話の中から分析のヒントを得たり勘を掴んだりしながらデータ分析を代行する役割であり、データ分析の知見を労働力の形で顧客に提供します。このため、成果物や目的が明確にならず、SIerのビジネスにおいて「なぜこれに取り組むのか」が分からなくなってしまう場合があります。統計解析手法により導き出された問題解決の方法が、必ずしもITによる方法にならないのです。これがSIer側のPoC継続のモチベーション低下を招き、お客さまとのWin-Winの関係が崩れ、PoCの終結につながる恐れがあります。
【次ページ】図で解説:なぜ、データ分析のPoCがITの仕事につながらないのか?
関連タグ