関連サイト
本書の関連ページが用意されています。
内容紹介
本書は「データ分析実務スキル検定(CBAS)」唯一の公式テキスト。試験範囲をすべてカバーし、模擬試験1回分を収録。プロジェクトマネジメント・統計・機械学習などの考え方、さらにはExcel・SQL・Python・Rの基本技術を解説しています。CBASは「データ分析を実務に活用するための最低限の知識と技能」を測るための検定です。試験問題は実際に想定できるケースに基づいており、実践力を判定できるという特徴があります。試験の内容を学習することで、データ分析における基礎的な力が自然と身につくようにデザインされています。
書誌情報
- 著者: 株式会社データミックス
- 発行日: 2021-09-22 (紙書籍版発行日: 2021-09-22)
- 最終更新日: 2021-09-22
- バージョン: 1.0.0
- ページ数: 512ページ(PDF版換算)
- 対応フォーマット: PDF, EPUB
- 出版社: インプレス
対象読者
データ分析を実務で行っている方、データ分析プロジェクトを指揮するマネジメント職の方を主な対象としています。
著者について
株式会社データミックス
データサイエンス領域における教育プログラムの企画・開発・運営を行う。個人向けスクールの運営および職業紹介を行うキャリアトランスフォーメーション事業や、企業研修やコンサルなどデータサイエンスを用いたビジネス課題の解決サービスを提供するビジネストランスレーション事業を展開。また、オンライン受験システム「Excert」をはじめとするEdTech事業やデータ分析におけるスキルアセスメント事業など、新規事業も手がける。
https://datamix.co.jp/
目次
サンプルデータ・解答・正誤表などについて
「データ分析実務スキル検定(CBAS)」について
本書について
目次
Part1 検定の概要
第1章 CBASへようこそ
- 1-1 CBASについて
- 1-2 CBAS試験の概要
- 1-2-1 試験範囲
- 1-2-2 試験方式
- 1-2-3 受験申し込みの流れ
- 1-2-4 試験の難易度について
- 1-2-5 試験内容と難易度の補足
- 1-3 本書の内容
- 1-4 シラバス詳細
Part2 プロジェクトマネジメント
第2章 ビジネス課題とKPIツリー
- 2-1 ビジネス課題の明確化
- 2-2 KPIツリーとは
- 2-2-1 KPIツリーの深さと要素の定義
- 2-3 KPIツリー作成の発想法
2-3-1 顧客行動に注目した分解
- 2-3-2 顧客属性に注目した分解
- 2-3-3 その他、さまざまな視点からの分解
2-3-4 掛け算と足し算
- 2-4 KPIツリーとデータ
- 2-5 KPIツリーの利用
2-5-1 分割要素と非分割要素
- 2-5-2 施策効果の検討
- 2-6 データ分析課題とデータ分析プロジェクト
- 2-6-1 データ分析課題
第3章 データ分析の活用とプロジェクト
- 3-1 既存の業務にデータ分析を活用する場合
3-1-1 非専門家によるデータ分析実務
- 3-1-2 データ分析の知識が必要となるとき
- 3-1-3 データ分析の専門知識が武器になるとき
- 3-2 データ分析プロジェクト
3-2-1 データ分析のプロセスモデル
- 3-2-2 データ分析プロジェクトのよくある失敗例:「データがあるからとりあえず分析」
- 3-2-3 データ分析プロジェクトのよくある失敗例:「手元のデータで十分」
- 3-2-4 データ分析プロジェクトの不確実性と「手戻り」
3-2-5 データ分析の不確実性
- 3-2-6 手戻りやループを含むプロセスモデル:CRISP
- 3-2-7 データ分析のプロセスモデルの例
- 3-2-8 PoCと不確実性
- 3-2-9 PoC止まりはなぜ起こるのか
3-2-10 KPIとリンクしていないPoCは失敗する
- 3-2-11 PoCを複数行う
3-3 データ分析プロジェクト・チームのマネジメント 3-3-1 データ分析プロジェクト・チームの典型的な構成
- 3-3-2 データ分析プロジェクトのステークホルダー
- 3-4 データ分析プロジェクトにおけるリスク
- 3-4-1 個人情報保護法
- 3-4-2 「個人情報取扱事業者」の義務
- 3-4-3 第三者へデータ分析業務を委託する場合の規律
第4章 データの準備
- 4-1 データ品質とは
- 4-1-1 データ品質を確認しよう
4-2 探索的データ分析(EDA)によってデータを理解する 4-2-1 EDAとは
- 4-2-2 EDA の実作業プロセス
- 4-2-3 EDAとデータの確認
4-2-4 EDAとデータ品質 4-2-5 EDAと可視化
- 4-3 データの前処理
- 4-3-1 データの前処理の種類
4-3-2 データクレンジング
- 4-3-3 データ補完
- 4-3-4 外れ値の処理
第5章 リサーチとレポーティング
- 5-1 リサーチデータのデータ分析
- 5-2 リサーチの流れ
5-2-1 定量調査と定性調査
- 5-2-2 リサーチデザイン
5-3 リサーチ結果のスクリーニング
- 5-3-1 基礎集計
- 5-3-2 クロス集計
- 5-3-3 仮説の検証
- 5-3-4 課題発見
- 5-3-5 施策の評価
第6章 予測モデルを使ったデータ分析
- 6-1 予測モデルの使い方
- 6-2 データ分析における「予測」とは何
6-3 予測モデルの基本的な作成手順 6-3-1 予測モデルを記述するための用語
- 6-3-2 予測モデル作成のプロセス
- 6-3-3 予測モデル作成プロセスの各ステップ
Part3 押さえておくべき理論
第7章 データ可視化の基本
- 7-1 可視化とデータの種類
7-1-1 データ可視化の目的
- 7-1-2 データのボリュームによって規定される可視化
- 7-2 1変数データの可視化
- 7-2-1 少数の1変数・量的データ
- 7-2-2 多数の1変数・量的データ
- 7-2-3 少数の1変数・質的データ
7-2-4 多数の1変数・質的データ
- 7-3 2変数データの可視化
7-3-1 2変数・量的データ
- 7-3-2 時系列データ
- 7-3-3 少数の2変数・混合データ(量×質)
- 7-3-4 多数の2変数・混合データ(量×質)
- 7-4 可視化のアンチパターン
第8章 統計学の基本
- 8-1 1変数データのまとめ方
8-1-1 代表値
- 8-1-2 平均値
- 8-1-3 中央値
- 8-1-4 最頻値
- 8-1-5 平均値と可視化
- 8-2 散布度
- 8-2-1 散布度の種類
- 8-2-2 範囲と四分位範囲
- 8-2-3 分散と標準偏差
- 8-2-4 標準偏差を評価に使う
- 8-2-5 質的データの整理
8-3 2変数データのまとめ方
- 8-3-1 量的変数×量的変数の整理
- 8-3-2 相関係数
- 8-3-3 相関と因果の違い
- 8-3-4 相関係数の利用
- 8-3-5 量的変数×質的変数の整理
- 8-3-6 質的変数×質的変数の整理
- 8-3-7 オッズとオッズ比
第9章 統計手法の基本
- 9-1 推測統計入門
9-1-1 統計一般の基礎知識
- 9-1-2 数学的な準備
- 9-2 仮説検定
9-2-1 仮説検定入門
- 9-2-2 具体的な検定手順
- 9-2-3 信頼区間
- 9-2-4 ABテスト
- 9-3 線形回帰
9-3-1 線形回帰入門
- 9-3-2 Rで線形回帰
第10章 機械学習の基本
- 10-1 代表的な教師あり学習
10-1-1 縦線・横線でデータを分ける[決定木]
- 10-1-2 多数決でデータを分ける[アンサンブル学習]
- 10-1-3 直線でデータを分ける[ロジスティック回帰]
- 10-2 その他の教師あり学習
10-2-1 ディープラーニングの基本[ニューラルネットワーク]
- 10-2-2 複雑な関数を近似する[ディープラーニング]
- 10-3 予測モデル作成の手順
10-3-1 精度の測り方[混同行列、AUC、MSEなど]
- 10-3-2 汎化性能の確認[クロスバリデーション]
- 10-3-3 より良い予測精度を求める[ハイパーパラメータのチューニング]
- 10-4 代表的な教師なし学習
10-4-1 より少ない次元でデータを表現する[主成分分析]
- 10-4-2 似ているデータをまとめる[クラスター分析]
- 10-5 この章のまとめ
Part4 理解しておくべき技術
第11章 Excelでできるデータ分析
- 11-1 ピボットテーブル
11-1-1 ピボットテーブルとは 11-1-2 ピボットテーブルを使ってみよう
- 11-1-3 発展的な使い方
- 11-2 データ集計に必要な関数
11-2-1 Excel関数とは 11-2-2 SUM関数
- 11-2-3 IF関数
- 11-2-4 COUNT関数とCOUNTIF関数
- 11-2-5 VLOOKUP関数
- 11-2-6 その他の便利な関数
第12章 SQLの基本
- 12-1 SQLで操作するデータベース
12-1-1 リレーショナルデータベースとは
- 12-1-2 なぜデータベースを利用するのか
- 12-2 SQLとは
12-2-1 SQLの種類
- 12-3 基本的なSQL構文
12-3-1 指定した列からの値の抽出[SELECT, FROM, WHERE, DISTINCT]
- 12-3-2 列の値ごとの集計[GROUP BY, COUNT, ORDER BY]
- 12-3-3 テーブルの結合[INNER JOIN, LEFT/RIGHT OUTER JOIN]
第13章 Pythonの基本
- 13-1 はじめに
13-2 Pythonを使用する環境 13-2-1 Jupyter Notebook
- 13-2-2 Google Colaboratory
13-2-3 Jupyter Notebookの使い方
- 13-2-4 コメント文
13-3 Pythonプログラミングの基本 13-3-1 演算
- 13-3-2 変数
- 13-3-3 変数の種類
- 13-3-4 比較演算子とbool型変数
- 13-3-5 関数print()
13-4 条件分岐(if~else文)
- 13-5 関数
- 13-6 練習問題
- 13-7 リスト[ ]とスライス
13-7-1 リスト
- 13-7-2 リストの操作
- 13-8 タプル( )とセット{ }
- 13-9 辞書(dict)
- 13-10 forループ
- 13-11 文字列の操作
- 13-12 pandas
- 13-12-1 DataFrameオブジェクトの操作
- 13-12-2 pandasの可視化メソッド
第14章 Rの基本
- 14-1 はじめに
14-2 Rを使用する環境 14-2-1 Rのインストール
- 14-2-2 RStudioのインストール
- 14-2-3 Working Directoryの設定
14-2-4 RStudioの初期画面
- 14-3 Rプログラミングの基本
14-3-1 演算
- 14-3-2 変数
- 14-3-3 主なデータ型
- 14-3-4 比較演算子とlogical型データ
- 14-3-5 print関数
- 14-4 条件分岐(if~else文)
- 14-5 関数
- 14-6 練習問題
- 14-7 ベクトル(vector)とコロン(:)
- 14-8 forループ
- 14-9 文字列のベクトル
- 14-10 2次元のデータ構造とデータフレーム
14-10-1 ファイルの読み書き
- 14-10-2 データフレームの作成
- 14-11 NA、NaN、NULL
- 14-12 可視化