• 会員限定
  • 2023/07/06 掲載

データよりも重要なのは「メタデータ」、すべてのデータ分析者が学ぶべきこと

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
データが加速度的に増大する中、データ分析の難度も重要性も増している。日本ではCDAO(最高データ/アナリティクス責任者)という役職を設置している企業は1%程度で、CDO(最高データ責任者)が分析責任者を事実上兼務していたり、VPoDA(Vice President of Data and Analytics)といった役職が代替していたりする。ガートナーのディスティングイッシュト バイス プレジデント, アナリスト、マーク・ベイヤー氏は、CDAOやそれに準ずる役職者、データ分析者に向けて、データ管理の最新トレンドや、データ管理にまつわる誤った思い込みとその結果で生じる間違い、その回避方法を解説する。

執筆:畑邊 康浩

執筆:畑邊 康浩

photo
ガートナー
ディスティングイッシュト バイス プレジデント, アナリスト
マーク・ベイヤー氏

データ管理は「目的に合わせる」から「ギャップを埋める」へ

 データは完全なものではなく、常に「部分」として存在する。そのため、たとえ大きなビジネスプロセスが存在していても、データアプリケーション構築の仕方は「分裂的」だ。すべてのデータアプリケーションはデータを部分に分割し、そのうちの一部分だけ取り込むよう設計されている。

 しかし、アナリティクスの段階では「分裂」から「融合」へ移行する。分割され、失われたデータ間の関係性を復元するということだ。ビジネスプロセスの中のデータは欠落している部分が多くあるため、いかにその穴を埋めるかがアナリティクスの鍵となる。

 データには、いわゆる「もつれ(エンタングル)」が存在する。「もつれ」とは量子力学の用語で、2つの要素が共鳴すると、その2つがどんなに離れても共鳴が維持される状態のこと。ビジネスプロセスにも「もつれ」は存在しており、どんなにまばらなデータや削除されたデータでも、「もつれ」を頼りに復元することができる。

 「ただ、それをするための方法を考えなければなりません」とベイヤー氏は話す。

データは「設計した通りにとどまらない」が当たり前

 「データには物理があり、データ管理にも物理があり、それがデータ管理環境に問題を引き起こします」とベイヤー氏は話す。

 最初にデータをキャプチャする時は、その時々の目的があり、目的に沿った形で収集するだろう。しかし、そのデータは、やがて異なる形・方法で再利用されるようになる。再利用する時の都合で便宜的にデータを接続することで、データは“固まって”しまい、各アセットの変更が難しくなる。

 そうなってしまう原因の1つに「データエントロピー」がある。データエントロピーとは、データがあちこちに飛散し(「疎」の状態)、設計した通りの形にとどまらない状態のことを指す。

画像
図1:データエントロピーはなぜ発生するのか
(出典:Gartner(2023年4月))

 エントロピー状態を見ると「間違っている」「あるべき状態ではない」ように思えるかもしれないが、これはある意味で正常な状態だ。「CDAOは、データが完全になりえないことを受け入れる必要がある」とベイヤー氏はいう。

 エントロピーの発生には、大きく4つの要因がある。

 1つ目は、データをキャプチャする時。たとえばアプリケーションを2つ作ったとして、うち1つは図1にある右上の図の青いデータをキャプチャし、もう1つはオレンジ色のデータをキャプチャしたとする。どちらのデータも部分的であり、それぞれのアプリケーションの目的に沿った必要最低限のものだ。つまり、すでにこの時点で「意図的に疎」なデータが作られている。

 2つ目は、ビジネスプロセスの特性から来るものだ。ビジネスプロセスはそもそも変化するように設計されており、反転したり分岐したりと変化することが前提となっている。そのビジネスプロセスの変化に対応するうちに、データエントロピーが発生する。

 3つ目は、データの価値に関わることだ。データの価値は、特定の視点に基づいて定義される。特定の視点というのは「次のステップで何をするか」という視点だ。それを意識して「どのデータをキャプチャするか」を定義することになり、結果としてまたエントロピーが発生する。

 4つ目は、データの設計の寿命がデータそのものの寿命と異なることに起因する。たとえばあるシステムにおいて、特定のビジネスタスクのステータスの値が12個までしか持てない設計がされていたとする。しかし、後からビジネス部門が「15個まで持てるようにしたい」と言ってきたら、新しい値を組み込まなくてはならない。データはある観点で設計され、後から観点が変わることがあるということだ。そしてまた、エントロピーを抱えることになる。

 「これら4つのことを、念頭に置いてください。なぜなら、実はこれがビジネスシグナルが発生する由来だからです。データエントロピーは、ビジネスシグナルに関係しているのです」とベイヤー氏は説明した。 【次ページ】データ要件とデータ内のビジネスシグナルの違い

関連タグ

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます