- 会員限定
- 2026/06/18 掲載
放置すればコスト3倍? ガートナーに学ぶ生成AI時代の「データ管理」新常識
社内に眠る「8割のデータ」がAIの武器に
生成AIの活用に向け、重要性が急速に増しているのが「非構造化データ」の管理だ。背景には生成AIにより、非構造化データの活用が格段に行いやすくなったことがある。生成AIの登場以前、データ活用で利用されるデータは、あらかじめ決められた形式(スキーマ)に従って整理され、機械的な検索や集計・分析が容易な表形式の「構造化データ」が大半だった。一方で、スキーマを持たず、事前に整理されていないテキストや画像、音声、センサーログなどの非構造化データも企業内に長らく蓄積されていたが、不規則性や曖昧さを含むことに起因する機械処理の難しさから活用はごく一部に限られていた。
ただし、生成AIの登場により状況は一変した。生成AIは従来、非構造化データ活用で必要とされた分類や抽出、要約などのための専門的な前処理を、自然言語による指示で実行可能だ。そして、企業内に蓄積されるデータの8割以上はオフィス文書をはじめとする非構造化データが占める。つまり、生成AIの登場で、社内に眠る膨大なデータ資産の活用の道が新たに拓かれたのだ。
AI支出が7倍に? コスト急増の未来がすぐそこに
これを差別化の武器とすべく、その下支えとして非構造化データ管理の強化に乗り出す企業が相次いでいる。ガートナーによれば、2028年までにエンタープライズ・アプリケーション・リーダーの半数はデータ/アナリティクス・リーダーから提供されるメタデータにより非構造化データを管理するようになり、非構造化データの管理のためのIT支出はデータ管理テクノロジー/サービスに対するIT支出の4割を占めるまでになる見通しだ。Gartner シニア ディレクター, アナリストのジェーソン・メッド氏は、「2029年までにAIデータ活用に向けたAI支出割合も7倍に拡大するでしょう。このコスト急増に我々は備えねばなりません」と訴える。
メッド氏は、非構造データの管理を「RAG(検索拡張生成)の基盤」と説明する。RAGの処理全体のうち、データソースからデータを取り込み、コンポーネント抽出やチャンキング、メタデータ抽出、要約などの前処理を行った後、処理後のデータから各種検索を行うまでの処理の仕組みがそれに該当する。
AI向け非構造化データ管理を必要とするユースケースの特徴は、「何らかの分類によって自動化を実現するケース」(メッド氏)という。具体的には、(1)従来のAIや機械学習での、顧客のセグメンテーションや不正検出、在庫予測、(2)AIの、あるドメインに特化した機能における営業やマーケティングなどのチャットボットや文章の要約、エージェント型AIでの顧客サービスの自動化やナレッジ・マネジメント、などだ。 【次ページ】ガートナー流、データ管理「4つの成功メソッド」
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR