関連サイト
本書の関連ページが用意されています。
内容紹介
データ加工、集計、分析に役立つSQLのノウハウを解説した入門書。
SQLを活用して仕事をする人というと、ITエンジニアのイメージがあります。しかし、集計・分析すべきマーケティングデータが膨大になってきている現在、マーケターやデータアナリストにとっても、SQLは習得しておくべきスキルとなりつつあります。本書では、データの加工、集計、分析に実践的に活用できるSQLのノウハウを、やさしくわかりやすく、実例を交えて解説していきます。
「Chapter1 データ集計の基礎知識」では、分析の基礎であるデータの加工・集計について必要な知識を学んでいきます。「データ分析」と聞くと何でも解決できそうなイメージがありますが、データ分析は決して魔法ではありません。分析の前にデータを隅々まで確認したり、集計したりして、全体の傾向を十分に把握してから分析を行う必要があります。
「Chapter2 SQLの基礎」では、データベースとは何かという話から、SQLの基本まで、簡単に解説します。
「Chapter3 分析への活用1 ~基本統計量と偏差値の算出など」から、実際にSQLを使っていきます。SQLを使った集計や便利な関数、そしてデータの特徴を表す基本統計量の算出といった分析につながる基本的な部分を解説していきます。
「Chapter4 分析への活用2 ~デシル分析、RFM分析など」では、SQLを使ったクロス集計に始まり、マーケティングシーンの分析で使われることの多い「デシル分析」や「RFM分析」について学習します。
「Chapter5 分析への活用3 ~アソシエーション分析、時系列分析、アトリビューション分析など」では、レコメンデーションによく用いられるアソシエーション分析の基礎的内容に始まり、デシジョンツリーや時系列分析といった比較的高度な分析手法、そしてインターネット広告の評価手法として用いられているアトリビューション分析について紹介します。
このように、本書はSQLの構文を習得するというよりは、実際の集計や分析に用いる手法をどのようにSQLで実現するか、というアナリスト視点から解説していきます。
「データベース構築の基本的・専門的概念だけを学んでも、データを分析することはできません。SQLはデータベース管理システム上でデータの操作や定義を行うためのデータベース言語でしかないのです。データ分析は何らかの目的を持って行なわれます。従って、分析を始めるにあたっては、出てきた結果が目的に合ったものかどうかの正しい判断が求められます。そのためには次の能力が必要です。
- 分析しようとする問題そのものについての理解
- 分析手法についての理解
- 分析結果に対しての判断力
また、分析に入る前の集計や加工の段階においても、この3点に繋がる意識と、目の前の取り組む事象についての正しい認識と本質的な理解が大変重要だといえます。
本書ではそうした内容についても重点的に解説しながら、分析はやっているけれどまだSQLを使ったことのないアナリストやこれからデータ分析をはじめる学生の方に向けて、非エンジニアが日々データと格闘しながら身につけた、分析のためのデータ加工・集計に実践的に使えるSQLノウハウを、データ分析を絡めて解説していきたいと思います。」(著者「はじめに」より)
書誌情報
- 著者: 株式会社ALBERT 巣山剛+データ分析部+システム開発・コンサルティング部
- ページ数: 298ページ(PDF版換算)
- 対応フォーマット: PDF
- 出版社: マイナビ出版
対象読者
著者について
株式会社ALBERT 巣山剛+データ分析部+システム開発・コンサルティング部
●株式会社ALBERT
2005年7月設立。事業コンセプトは『分析力をコアとするマーケティングソリューションカンパニー』。高度なマーケティングソリューションを提供するためのコアコンピタンスである『分析力』は、アナリティクス領域における「マーケティングリサーチ」「多変量解析」「データマイニング」「テキスト&画像解析」、エンジニアリング領域における、「大規模データ処理」「ソリューション開発」「プラットフォーム構築」「最適化モデリング」の8つのテクノロジーで支えられている。8つのテクノロジーには豊富な実績に裏付けられた、ALBERT独自のアルゴリズムや手法が用いられており、優位性を確保。
●巣山 剛(すやま ごう)
株式会社ALBERT データ分析部 マネージャー。2006年2月株式会社ALBERT入社。メディアサイトの運営やレコメンデーションサービス立ち上げプロジェクトへの参加、カスタマーサポート担当などさまざまな業務を経験。2008年9月には、日本行動計量学会 第36回大会チュートリアルセミナーにて、「リコメンデーションの理論と実際」と題し共同発表。2011年10月よりデータ分析業務に従事。SQLやUNIX、Ruby、PHPなどの言語を利用したデータハンドリングを得意とする。日々データと格闘する傍ら、アルバイトやインターンを指導。部署全体の分析力向上をはかる。
データ分析部ブログ(http://www.albert2005.co.jp/analyst_blog/)
●安達 章浩(あだち あきひろ)
株式会社ALBERT 執行役員 データ分析部部長。自動車メーカー、コンサルティングファーム勤務を経て、1995年にデータマイニングを専門とした会社を設立。以来約20年に渡り、大手メーカーを中心とした生産・販売・物流データの分析、流通・小売業を中心としたPOSデータの分析、飲食業を中心とした新規出店売上げ予測システムの構築等を多数手掛ける。また、デシジョンツリー分析、サポートベクターマシン、ベイジアンネットワーク最適化など機械学習分野の手法を様々な企業に導入し、意思決定支援の効率化に寄与する。その他、統計解析と多変量解析のマーケティングへの応用を、長期にわたり宣伝会議に連載。2013年2月株式会社ALBERT入社。同年4月執行役員、データ分析部 部長に就任。
●池内 孝啓(いけうち たかひろ)
株式会社ALBERT 執行役員 システム開発・コンサルティング部部長。2011年3月株式会社ALBERT入社。社内システムの整備やインフラ構築全般、複数の開発プロジェクトに関わる。2012年4月より、部門再編に伴い受託開発、自社サービス開発の責任者を務め、商品力の強化と開発部門の技術力の底上げに注力。2013年からはsmarticA!ソリューションの事業拡大のためプロジェクトを遂行するとともに、プライベートDMPの活用を促進する講演を多数行なう。2014年1月執行役員、システム開発・コンサルティング部 部長に就任。
ブログ(http://librabuch.jp/)
Twitter:@iktakahiro
●大木 展子(おおき ひろこ)
株式会社ALBERT データ分析部。Web系SEのキャリアと技術をコアに、日々ビッグデータと格闘中
目次
Chapter 1 データ集計の基礎知識
- 1-1 集計は分析のための大切な土台作り
- 前処理が重要
- 1-2 集計レポートとは
- 正しい認識と理解をする
- 1-3 集計レポートの種類
- アンケート調査(定量調査)レポート サンプル
- インターネット広告レポート サンプル
- 商品レコメンド効果測定レポート サンプル
- 1-4 代表的な集計方法
- シンプルでわかりやすい集計レポートのために
- 単純集計(GT集計)
- クロス集計
- ピボットテーブル
- 1-5 データの読み方
- 平均の罠
- 正しい現状認識の上にゴールへの道すじを描く
- データの形式
- データの容量
- データの表頭・表側と内容
- データの疎密状態の把握も忘れずに
- 1-6 グラフの使い分け
- データの可視化
- 棒グラフ
- 折れ線グラフ
- 円グラフ
- 帯グラフ
- レーダーチャート
- 散布図
- 箱ひげ図
Chapter 2 SQLの基礎
- 2-1 SQLとは
- SQLとデータベース
- さまざまなDBMS
- 2-2 テーブル設計とデータ操作
- SQLの処理の流れ
- 単純なテーブル設計とデータ操作
- 少しだけ複雑なテーブル設計とデータ操作
- PRIMARY KEY を利用したテーブル設計とデータ操作
- より実践的なテーブル設計とデータ操作
- JOIN
- 2-3 データ型
- データの定義
- INT、BIGINT
- CHAR、VARCHAR
- DATE、TIMESTAMP
Chapter 3 分析への活用1 ~基本統計量と偏差値の算出など
- 3-1 集計関数・分析関数
- 四則演算
- 集計関数
- GROUP BY句の処理イメージ
- データ集計・加工フェーズで大事なこと
- WHERE句とHAVING句
- 分析関数
- 3-2 基本統計量と偏差値の算出
- 基本統計量とは
- Excelでの算出
- SQLでの算出
- 偏差値を知る
Chapter 4 分析への活用2 ~デシル分析、RFM 分析など
- 4-1 分析の基礎 ~クロス集計~
- クロス集計でわかるデータの真実
- SQLでのクロス集計
- 4-2 デシル分析
- デシル分析とは
- Excelでの対応例
- SQLでの対応例
- 4-3 RFM分析
- RFM分析とは
- SQLでの対応例
- Frequencyランクを求めるSQL
- Monetaryランクを求めるSQL
- RFM分析の活用例
Chapter 5 分析への活用3 ~アソシエーション分析、時系列分析、アトリビューション分析など
- 5-1 アソシエーション分析
- アソシエーション分析とは
- SQLでの対応例
- アプリオリ・アルゴリズム
- 5-2 デシジョンツリー
- デシジョンツリーとは
- CHAIDの基礎
- SQLでCHAIDを行う
- 5-3 時系列分析
- 時系列分析とは
- 代表的な時系列分析法
- 季節調整法の実際
- 乗法モデルの分析の実際
- SQLで時系列分析
- 5-4 アトリビューション分析(均等配分モデル)
- アトリビューション分析とは
- 従来型アトリビューション分析の手法
- SQLでの対応例(均等配分モデル)
- ALBERTアトリビューションモデル