関連サイト
本書の関連ページが用意されています。
内容紹介
ビジネスユーザーも腑に落ちる! Excelでアルゴリズムの仕組みをとらえよう。プロジェクト準備のための第一歩。
Part 1では、機械学習の全体像、ExcelやPythonの基本事項を解説、どのような状況や体制であれば機械学習を利用してよいのかを確認。さらに、具体的な活用シーンもイメージできるようにします。
Part 2では、機械学習の各アルゴリズムをExcelで実現する方法を説明。Pythonコードによる実装例も紹介します。線形回帰、ロジスティック回帰、クラスタリングなどの仕組みを具体的に理解できるようにしていきます。アルゴリズムのメリット/デメリット、向き/不向きがわかれば、ビジネスへの応用の可能性も見えてくるでしょう。機械学習を理解していく最初の一歩として本書をご活用ください。
●データ活用における機械学習の役割/位置づけを理解できる
●Excelに展開することで、仕組みをより具体的に把握できる
●ビジネスの現場に活かせる具体的な理解を獲得できる
●より実務的なPythonコードによる実装方法も把握できる
書誌情報
- 著者: 堅田洋資, 福澤彰吾
- 発行日: 2019-12-20 (紙書籍版発行日: 2019-12-20)
- 最終更新日: 2019-12-20
- バージョン: 1.0.0
- ページ数: 232ページ(PDF版換算)
- 対応フォーマット: PDF, EPUB
- 出版社: インプレス
対象読者
機械学習の具体的なイメージを得たい方。ビジネス側から機械学習の仕組みを知りたい方。Excelの関数や数値は追える方。エンジニアだが本格的な数式には抵抗がある方。
著者について
堅田洋資
株式会社データミックス 代表取締役社長。2005年に一橋大学商学部を卒業。2013年7月より米国サンフランシスコ大学のデータ分析学修士コースへ留学。その後、監査法人トーマツにてデータ分析コンサルタント、白ヤギコーポレーションにてレコメンデーションアルゴリズム開発/コンサルティング、データサイエンス企業研修/スクール企画運営。2017年に株式会社データミックスを起業、データサイエンティスト育成を中心事業として展開。
福澤彰吾
株式会社データミックス 所属。静岡大学理学部を卒業。SIerを経て、2019年に株式会社データミックスに入社。データサイエンティスト育成コースの講師で主に機械学習を担当。
目次
はじめに
目次
第1部 ビジネス活用への第一歩
第1章 機械学習のイメージをつかむための基本と道具
- 1.1 機械学習とは
- 1.1.1 AI・人工知能、機械学習、ディープラーニングの違い
- 1.1.2 機械学習の種類
- 1.2 機械学習をビジネスで活用するための考え方
- 1.2.1 とにかく具体的に考える
- 1.2.2 自身の業務の中で「タスク」を考える
- 1.3 Excelで学ぶメリット
- 1.4 Pythonの基本
- 1.4.1 計算
- 1.4.2 変数
- 1.4.3 条件分岐
- 1.4.4 forループ
- 1.4.5 関数
- 1.4.6 ライブラリの読み込み
- 1.4.7 CSVファイルの読み込み
- 1.5 簡単! Colaboratoryの使い方
第2章 機械学習のビジネス活用事例を知ろう
- 2.1 データの利活用のレベル感を意識すること
- 2.1.1 データ活用=AI・機械学習の活用なのか
- 2.1.2 データ活用レベルの5段階
- 2.1.3 どのレベルから始めるべきか
- 2.1.4 マネジメントも変わる必要がある
- 2.2 ビジネスにおける機械学習プロジェクトの流れ
- 2.2.1 解約予測の例
- 2.2.2 データの準備
- 2.2.3 モデリング
- 2.2.4 モデルの評価と精度指標
- 2.2.5 混同行列と4つの指標
- 2.2.6 AUC
- 2.2.7 ビジネス現場での適用
- 2.3 他分野への適用
第2部 Excelでアルゴリズムの仕組みをとらえよう
第3章 価格や売上を予測するアルゴリズム[線形回帰モデル]
- 3.1 線形回帰モデルとは
- 3.1.1 シンプルな例:営業部署別の営業担当者数と売上の関係を考える
- 3.1.2 線形回帰モデルでは
- 3.1.3 Excelで作ってみよう
- 3.2 勾配降下法の仕組み
- 3.2.1 勾配降下法のイメージ
- 3.2.2 勾配降下法の式
- 3.2.3 線形回帰モデルでの勾配降下法
- 3.2.4 線形回帰モデルでの勾配の計算式
- 3.2.5 Excelで勾配降下法を使った線形回帰モデルを作ってみよう
- 3.3 曲線でフィッティングする
- 3.3.1 多項式回帰
- 3.3.2 過学習とは
- 3.4 交差検証(クロスバリデーション)
- 3.5 正則化
- 3.5.1 リッジ回帰をExcelで作成する
- 3.5.2 LASSO回帰をExcelで実装する
- 3.6 Pythonでの実行方法
- 3.6.1 線形回帰
- 3.6.2 リッジ回帰
- 3.6.3 LASSO回帰
- 3.6.4 多項式回帰
第4章 YesかNoか―2値を予測しよう[ロジスティック回帰モデル]
- 4.1 ロジスティック回帰モデルとは
- 4.1.1 シンプルな例:年収と勤続年数からローンを完済できるかを予測する
- 4.1.2 線形回帰モデルではいけない理由
- 4.1.3 ロジスティック回帰モデルのコンセプト
- 4.2 最尤推定
- 4.2.1 同時に起こる確率を求める
- 4.2.2 コイン投げの例
- 4.2.3 細工されているコイン
- 4.3 ロジスティック回帰モデルの目的関数
- 4.3.1 対数とは
- 4.3.2 尤度に対数を適用した対数尤度
- 4.3.3 交差エントロピー誤差関数
- 4.4 Excelで実装してみよう
- 4.4.1 Excelでロジスティック回帰を実装する
- 4.5 Pythonでやってみよう
- 4.5.1 必要なライブラリをインポート
- 4.5.2 使用するデータの作成
- 4.5.3 学習用と検証用のデータに分割
- 4.5.4 説明変数と目的変数の設定
- 4.5.5 ロジスティック回帰の実装
- 4.5.6 切片と傾きの確認
- 4.5.7 作成したモデルを用いた予測
- 4.5.8 モデルの精度評価
第5章 グループに分けてとらえよう[クラスタリング]
- 5.1 クラスタリングとは
- 5.1.1 良いグルーピングと悪いグルーピングの違い
- 5.1.2 K-means法の目的関数
- 5.1.3 K-means法のアルゴリズム
- 5.1.4 エルボー法
- 5.1.5 実務で適用する際の注意点
- 5.2 Excelでの実装
- 5.3 K-means法を使う際の注意
- 5.3.1 スケールを揃える
- 5.3.2 クラスターは超球面であることを想定
- 5.4 Pythonでの方法
- 5.4.1 必要なライブラリをインポート
- 5.4.2 使用するデータの作成
- 5.4.3 K-means法の実装
- 5.4.4 クラスタリングした結果の確認
第6章 余分な情報を削ぎ落とそう[次元削減]
- 6.1 主成分分析とは
- 6.1.1 6人のテスト結果の総合学力指標を考えよう
- 6.1.2 主成分分析と「総合学力」の関係
- 6.1.3 情報量は分散で表現できる
- 6.1.4 軸の回転のイメージ
- 6.1.5 失われた情報量を補う第2主成分
- 6.2 何次元に圧縮するのか
- 6.2.1 各主成分と分散の大きさの順序
- 6.2.2 寄与率
- 6.3 Excelで実装しよう
- 6.3.1 ブランドのアンケート結果の例
- 6.4 主成分分析を使った分析例
- 6.4.1 因子負荷量の解釈
- 6.4.2 ブランドマップの作成
- 6.5 固有値分解を用いた主成分分析
- 6.6 Pythonでの実装
- 6.6.1 必要なライブラリをインポート
- 6.6.2 使用するデータの作成
- 6.6.3 次元削減(PCA)の実装
- 6.6.4 次元削減した結果の確認
第7章 予測ルールを自動生成しよう[決定木]
- 7.1 決定木とは
- 7.1.1 決定木アルゴリズムの概要
- 7.1.2 ツリーでルールを表現する
- 7.1.3 予測
- 7.1.4 決定木で出てくる用語
- 7.2 決定木アルゴリズムの種類
- 7.2.1 CART(Classification And Regression Tree)
- 7.2.2 C4.5
- 7.2.3 CHAID(Chi-squared Automatic Interaction Detection)
- 7.3 分類木
- 7.3.1 CARTの目的関数「ジニ係数」
- 7.3.2 C4.5の目的関数である「情報エントロピー」
- 7.3.3 Excelでの実装
- 7.4 回帰木
- 7.4.1 回帰木の目的関数
- 7.5 決定木をどこまで伸ばすか
- 7.5.1 CVエラーと標準誤差
- 7.5.2 1SEルール
- 7.6 Pythonでやってみよう
- 7.6.1 必要なライブラリのインポート
- 7.6.2 使用するデータの作成
- 7.6.3 説明変数と目的変数の設定
- 7.6.4 決定木の実装
- 7.6.5 決定木の可視化
- 7.6.6 予測と精度評価
第8章 高度な機械学習アルゴリズムを理解しよう
- 8.1 ニューラルネットワーク
- 8.1.1 ニューラルネットワークの概要
- 8.1.2 ニューラルネットワークの学習方法
- 8.1.3 メリット・デメリットと使いどころ
- 8.1.4 Pythonでの実行方法
- 8.2 ランダムフォレスト
- 8.2.1 ランダムフォレストの概要
- 8.2.2 メリット・デメリットと実務での使いどころ
- 8.2.3 Pythonでの実行方法