開閉ボタン
ユーザーメニュー
ユーザーメニューコンテンツ
ログイン

データブリックス・ジャパン株式会社、日本マイクロソフト株式会社提供コンテンツ

  • スペシャル
  • 会員限定
  • 2020/12/28

技術文書

ホワイトペーパー
「Apache Spark」を8つのステップで学ぶ、データレイク構築ガイド
DX(デジタルトランスフォーメーション)にデータ活用は不可欠で、近年、非構造化データの分析、利活用が注目を集めている。そこで注目されるのが、あらゆる構造化 & 非構造化データを統合して管理し、活用のための前処理を行える「データレイク」だ。本書は、Databricksの「Delta Lake」と「Apache Spark」を用いたデータレイク構築に関する開発者向けの解説書だ。インメモリで処理を行う並列分散処理フレームワーク「Apache Spark」と、高信頼性とパフォーマンス、ライフサイクル管理を可能にするオープンソースストレージレイヤー「Delta Lake(デルタレイク)」を用い、データサイエンティストやエンジニア、ビジネスユーザーが利用しやすいデータレイクの構築方法について学習できる。
ページ数:35ページ
内容(一部抜粋)
●Apache Sparkを選ぶ理由とアーキテクチャの概念
●DataFrame、Dataset、Spark SQLの要点
●構造化ストリーミングによる継続的なアプリケーション
●機械学習と高信頼性データレイク

この続きは会員限定です

ここから先は「ビジネス+IT プレミアム会員」に登録の方(登録は無料)のみ、ご利用いただけます。

今すぐビジネス+IT会員にご登録ください。

すべて無料!ビジネスやITに役立つメリット満載!

  • 1

    インタビューから事例記事まで、ここでしか読めない1万本超の記事が無料で閲覧可能

  • 2

    導入事例資料や技術資料、デモ動画などを無料でダウンロード・閲覧可能

  • 3

    年間1,000本以上、会員限定のスペシャルセミナーにご招待

  • 4

    ビジネス+IT編集部が必読記事を、メールマガジンでお知らせ!

ビジネス+IT 会員登録で、会員限定コンテンツやメルマガを購読可能、スペシャルセミナーにもご招待!