湖(データレイク)にたまった水を“価値のある飲料水”に変えるには?
CTO対談:ビッグデータ活用を阻む“技術の壁”を乗り越えるための選択肢
ビッグデータの基盤として存在感を増すHadoop。その理由とは?
特に注目したいのは、活用するデータが大きく広がっている点だ。これまでシステム上で管理してきた取引データに加え、「IoT(Internet of Things)」によって生み出される各種センサー類から発信される「計測データ」や「ログデータ」も当然のように使われるようになった。製品や機器にセンサーを組み込めば、予防保守サービスや新製品の開発に役立てることもできる。
データの広がりは「構造化データ」だけにとどまらない。電子メールやソーシャルメディアなどを通じてやりとりされる「テキストデータ」「音声データ」「動画データ」といった「多構造化データ」も多くの企業が活用するようになった。こうした情報を的確に分析できれば、顧客満足度の向上や売上の拡大、さらにはイノベーションを創出する可能性も高くなる。
そこで最近では、システムで日々収集される膨大なデータを、巨大なリポジトリに、そのまま格納する「データレイク(Data Lakes:データの湖)」というコンセプトが大きな注目を集めている。
このデータレイクの実現に向け、重要な技術基盤と捉えられているのがHadoopだ。Hadoopは、多構造化データを含む大量のデータを溜め、分散並列処理するためのプラットフォームとして、日本でもすでに多くの企業で活用されている。このHadoopによるデータレイクは、サイロ化されたデータの解消にも役立ち、有効な分析用データ基盤となる。
「Hadoopならシステムによる容量制限から解放されます。つまり、これまで捨てざるを得なかったようなデータも含め、多種多様かつ膨大なデータを格納し、活用していくことができるわけです」とブロブスト氏は説明する。
・単一のベンダーが提供する技術には限界がある
・テラデータ×MapRの協業強化で、データ活用に高度な価値を提供
今すぐビジネス+IT会員にご登録ください。
すべて無料!ビジネスやITに役立つメリット満載!
-
ここでしか見られない
1万本超のオリジナル記事が無料で閲覧可能
-
多角的にニュース理解
各界の専門家がコメンテーターとして活躍中!
-
スグ役立つ会員特典
資料、デモ動画などを無料で閲覧可能!セミナーにご招待
-
レコメンド機能
あなたに合わせた記事表示!メールマガジンで新着通知
関連タグ