ギフトで購入

Apache Sparkビッグデータ性能検証

伊藤雅博, 木下翔伍

2,200円 (2,000円+税)

ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。

内容紹介

ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。

本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。

※本書は、インプレスが運営するWebメディア「Think IT」で、「ユースケースで徹底検証！ Sparkのビッグデータ処理機能を試す」として連載された技術解説記事を書籍用に再編集したものです。
※本書の内容は、執筆時点（2016年7月～2017年1月）までの情報を基に執筆されています。

書誌情報

著者: 伊藤雅博, 木下翔伍
発行日: 2017-05-12 (紙書籍版発行日: 2017-05-12)
最終更新日: 2017-05-12
バージョン: 1.0.0
ページ数: 106ページ(PDF版換算)
対応フォーマット: PDF, EPUB
出版社: インプレス

対象読者

ユーザー企業のシステムエンジニア、Sier

著者について

伊藤雅博

株式会社日立製作所　OSSソリューションセンタ所属。これまでにストレージ装置とその管理ソフトウェアの開発に従事してきた。現在はHadoop/Spark/HBaseを中心としたビッグデータ関連OSSの導入支援やソリューション開発に従事している。最近は学生時代に取り組んできた機械学習やデータ分析に再び取り組みたいと考えている。

木下翔伍

株式会社日立製作所　OSSソリューションセンタ所属。これまでにIaaS稼働監視サービスの基盤開発、OpenStackを題材にしたクラウド基盤の運用管理に関する研究、CloudFoundryの検証・評価業務などに従事してきた。現在はビッグデータに関するソリューション開発やOSSの検証業務に従事している。

Apache Sparkビッグデータ性能検証

関連サイト

内容紹介

書誌情報

対象読者

著者について

伊藤雅博

木下翔伍

目次

目次

第1章 Spark Streamingの概要と検証シナリオ

第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方

第3章 Kafka、Spark、Elasticsearch のパラメータチューニング

第4章マシン台数の調整とシステム全体のボトルネックについての考察

第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証

第6章 Spark 2.0の性能検証の結果とボトルネックの考察

第7章 Sparkのデータ処理プロセスと処理性能のボトルネック

第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成

著者紹介

Apache Sparkビッグデータ性能検証

関連サイト

内容紹介

書誌情報

対象読者

著者について

伊藤 雅博

木下 翔伍

目次

目次

第1章 Spark Streamingの概要と検証シナリオ

第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方

第3章 Kafka、Spark、Elasticsearch のパラメータチューニング

第4章 マシン台数の調整とシステム全体のボトルネックについての考察

第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証

第6章 Spark 2.0の性能検証の結果とボトルネックの考察

第7章 Sparkのデータ処理プロセスと処理性能のボトルネック

第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成

著者紹介

伊藤雅博

木下翔伍

第4章マシン台数の調整とシステム全体のボトルネックについての考察