• 会員限定
  • 2012/04/16 掲載

「ETLフレームワーク」でグーグルとフェイスブックから学ぶビッグデータ活用の基本

ソーシャルコマースの覇者はだれか?

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
企業には、勤怠データ、顧客データ、販売データなど、多様なデータが溢れています。また最近ではツイッターや、フェイスブックへの書き込みも増えてきました。一方で、データを集めただけでは収益をあげることはできません。ではどうやって集めてきたデータから収益をあげるのか、その答えの1つが「ETLフレームワーク」と呼ばれるものです。本稿では、このETLフレームワークの基礎と、グーグルとフェイスブックを例にして、両社がいかにデータを価値あるものとしてマネタイズ化(収益化)しているのかについてご紹介しましょう。

フューチャーブリッジパートナーズ 長橋賢吾 編集:編集部 松尾慎司

フューチャーブリッジパートナーズ 長橋賢吾 編集:編集部 松尾慎司

2005年東京大学大学院情報理工学研究科修了。博士(情報理工学)。英国ケンブリッジ大学コンピュータ研究所訪問研究員を経て、2006年日興シティグループ証券にてITサービス・ソフトウェア担当の証券アナリストとして従事したのち、2009年3月にフューチャーブリッジパートナーズ(株)を設立。経営コンサルタントとして、経営の視点から、企業分析、情報システム評価、IR支援等に携わる。アプリックスIPホールディングス(株) 取締役 チーフエコノミスト。共著に『使って学ぶIPv6』(アスキー02年4月初版)、著書に『これならわかるネットワーク』(講談社ブルーバックス、08年5月)、『ネット企業の新技術と戦略がよーくわかる本』(秀和システム、11年9月)。『ビックデータ戦略』(秀和システム、12年3月)、『図解:スマートフォンビジネスモデル』(秀和システム、12年11月)。
ホームページ: http://www.futurebridge.jp

ビッグデータ関連記事一覧

ETLフレームワークの基本

 世の中にはデータが溢れています。たとえば、企業では、出社時刻・退社時刻を記録した勤怠データ、顧客の情報を記録した顧客データ、製品の売上を記録した販売データがあるでしょう。あるいは、Web検索、携帯メール、ツイッター、フェイスブックへの書き込みなど、私たちの身の回りにもデータは存在しています。ただ、これらのデータをただ集めただけでは、単なる文字列の羅列で何の意味もありません。

 では、どうやって、集めたデータから収益を上げるのでしょうか?その答えの一つが、ETLフレームワークです。ETLフレームワークとは、E(Extract:抽出)、T(Transform:変換・加工)、L(Load:積み込み)の3つのプロセスを経ることによって、単なる文字の羅列であるデータから付加価値を生み出す考え方です。

photo
図1 ETLフレームワーク
(筆者作成)

 まずは、このETLフレームワークをみていきましょう。ETLフレークワークは、図1のように、データを集めることから始まります。それがE(Extract:抽出)です。この段階では、それぞれのデータがどんな意味を持つのかはあまり気にしません。とにかく、データを収集します。

 しかしながら、データを単に収集しただけでは何も付加価値はありません。収集したデータを何かしらの切り口に基づいて整理整頓(仕分け)する必要があります。これがT(Transform:変換・加工)です。

 たとえば、集めたデータ中の性別のフィールドに、“紳士”、“男性”、“Male”という3つの同じ意味でも異なる語句の場合、それをまとめて、“男”として変換・加工(正規化)します。これによって、バラバラに取得したデータを同じ土俵で比較することができるようになります。

 最後に、同じ土俵で比較できるようになったデータをデータ倉庫(DWH:データウェアハウス)に保存して、いつでも取り出せて、更新があれば書き換えるようにデータを出し入れします。これが最後のL(Load:積み込み)です。

 このETLフレームワークによって、単に文字の羅列であるデータから付加価値を生み出すサービスへと変えるのです。ETLフレームワークは、データウェアハウスを構築する場合に必須の概念ですが、データウェアハウスに限った話ではありません。

 そこで、データ活用の代表的な企業であるグーグルおよびフェイスブックの2社に焦点をあてて、どのようにデータを価値あるものにしているのかについて、解説していきましょう。

【次ページ】グーグルのデータ活用戦略

関連タグ

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます