試験公開中

このエントリーをはてなブックマークに追加

Apache Sparkビッグデータ性能検証

インプレス

2,000円+税

ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。

関連サイト

本書の関連ページが用意されています。

内容紹介

ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。

本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。

※本書は、インプレスが運営するWebメディア「Think IT」で、「ユースケースで徹底検証! Sparkのビッグデータ処理機能を試す」として連載された技術解説記事を書籍用に再編集したものです。
※本書の内容は、執筆時点(2016年7月~2017年1月)までの情報を基に執筆されています。

書誌情報

  • 著者: 伊藤 雅博, 木下 翔伍
  • 発行日: (紙書籍版発行日: 2017-05-12)
  • 最終更新日: 2017-05-12
  • バージョン: 1.0.0
  • ページ数: 106ページ(PDF版換算)
  • 対応フォーマット: PDF, EPUB
  • 出版社: インプレス

対象読者

ユーザー企業のシステムエンジニア、Sier

著者について

伊藤 雅博

株式会社日立製作所 OSSソリューションセンタ所属。これまでにストレージ装置とその管理ソフトウェアの開発に従事してきた。現在はHadoop/Spark/HBaseを中心としたビッグデータ関連OSSの導入支援やソリューション開発に従事している。最近は学生時代に取り組んできた機械学習やデータ分析に再び取り組みたいと考えている。

木下 翔伍

株式会社 日立製作所 OSSソリューションセンタ所属。これまでにIaaS稼働監視サービスの基盤開発、OpenStackを題材にしたクラウド基盤の運用管理に関する研究、CloudFoundryの検証・評価業務などに従事してきた。現在はビッグデータに関するソリューション開発やOSSの検証業務に従事している。

目次

目次

第1章 Spark Streamingの概要と検証シナリオ

第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方

第3章 Kafka、Spark、Elasticsearch のパラメータチューニング

第4章 マシン台数の調整とシステム全体のボトルネックについての考察

第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証

第6章 Spark 2.0の性能検証の結果とボトルネックの考察

第7章 Sparkのデータ処理プロセスと処理性能のボトルネック

第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成

著者紹介

Home 書籍一覧 Apache Sparkビッグデータ性能検証 ▲ ページトップへ戻る