ギフトで購入

はっきりわかるデータサイエンスと機械学習

横内大介, 大槻健太郎, 青木義充

3,520円 (3,200円+税)

本書ではデータサイエンスのサイクルを意識してモデリングを行う方法と、機械学習にもとづくコンピュータインテンシブな方法の二つを中心に解説しています。データサイエンスとデータエンジニアリングのコンセプトをしっかりと理解し、両者を使いこなす人材が求められている今、必読の一冊です。

内容紹介

AIの要である機械学習は、結果を導き出す過程がブラックボックス化する問題があり、AI実用化の障害となっている。その解決策として、丹念なデータ分析によりデータの背景にある現象を統計モデルで表現する、本来の意味での「データサイエンス」の活用が期待されている。メカニズムが理解可能なモデルをAIの頭脳に使うことで、AIの透明化——すなわち説明可能なXAIも実現できる！

本書ではデータサイエンスの考えに基づく統計モデリングの解説に加え、機械学習の代表的な手法をRを用いて体験していく。本書を読み込めば、探索的データ解析と機械学習、それぞれの本質を学ぶことができる。

書誌情報

著者: 横内大介, 大槻健太郎, 青木義充
発行日: 2020-05-29 (紙書籍版発行日: 2020-05-29)
最終更新日: 2020-05-29
バージョン: 1.0.0
ページ数: 236ページ(PDF版換算)
対応フォーマット: PDF, EPUB
出版社: 近代科学社

対象読者

著者について

横内大介

2005年慶應義塾大学大学院理工学研究科後期博士課程基礎理工学専攻数理科学専修修了，博士（工学）
2005年慶應義塾大学理工学部データサイエンス研究室助手，その後，一橋大学大学院国際企業戦略研究科専任講師を経て，現在，同大学院経営管理研究科准教授．
専門分野はデータサイエンス，統計ソフトウェア，計量ファイナンス．

大槻健太郎

2015年一橋大学大学院国際企業戦略研究科金融戦略・経営財務コース修了，経営修士（専門職）
2003年オリックス株式会社に入社し同社営業部，財務部を経て，株式会社QUICK へ入社．現在，同社サービスプロダクト本部サービス企画グループ副部長．
専門分野はデータサイエンス，アセットファイナンス．

青木義充

2004年慶應義塾大学大学院理工学研究科後期博士課程基礎理工学専攻単位取得済退学
2014年総合研究大学院大学複合科学研究科後期博士課程統計科学専攻修了，博士（学術）
2004年一橋大学大学院国際企業戦略研究科助手，その後，株式会社QUICK を経て，現在，株式会社エフビズ代表取締役．
専門分野は時系列解析，ベイズ統計学，データサイエンス．

1.1 データにもとづく帰納的な推論
1.2 エンジニアリングとサイエンスの違い
1.3 データリテラシー
1.3.1 矩形データ
1.3.2 ドメインとデータベクトルの属性
1.3.3 リレーショナルデータの属性
1.3.4 データ浄化
1.4 モデリング
1.5 モデリングの2つのアプローチ
1.6 過剰適合
1.7 モデリングのためのソフトウェア環境

2 データサイエンスによるモデリング

2.1 Kyphosisデータ
2.2 データブラウジング
2.2.1 箱ひげ図
2.2.2 条件付き箱ひげ図による分類の診断
2.2.3 散布図における平滑化の活用
2.3 一般化線形モデルを使ったモデリングの検討
2.3.1 一般化線形モデルの基礎
2.3.2 Rによる一般化線形モデルのあてはめ
2.3.3 最尤推定法における代表的な残差
2.4 セミパラメトリックなモデルの検討
2.4.1 一般化加法モデル
2.4.2 Rによる一般化加法モデルの当てはめ
2.5 さらなるモデルの検討

3 教師あり機械学習の基礎

3.1 ロジスティック判別
3.1.1 ロジスティック判別の基礎
3.1.2 Rによるロジスティック判別の実行
3.1.3 学習器の性能評価と検証法
3.2 サポートベクターマシン
3.2.1 サポートベクターマシンの基礎
3.2.2 Rによるサポートベクターマシンの実行
3.3 決定木
3.3.1 分類木の基礎
3.3.2 Rによる分類木の生成
3.3.3 決定木の問題点
3.4 バギングとブースティング
3.4.1 ブートストラップ法とバギングの基礎
3.4.2 Rによるバギングの実行
3.4.3 ブースティングとアダブーストの基礎
3.4.4 Rによるアダブーストの実行
3.5 ランダムフォレスト
3.5.1 ランダムフォレストの基礎
3.5.2 Rによるランダムフォレストの実行
3.5.3 ランダムフォレストの並列化

4 教師なし機械学習の基礎

4.1 クラスタリング
4.1.1 階層的クラスタリング
4.1.2 K-means法
4.1.3 混合分布によるクラスタリング
4.2 主成分分析
4.2.1 次元の削減
4.2.2 主成分分析と主軸変換
4.2.3 中心化と尺度基準化
4.2.4 主成分分析
4.2.5 特異値分解
4.2.6 主成分分析の解釈

5 ニューラルネットワーク入門

5.1 はじめに
5.2 層の追加～フィードフォワードニューラルネットワークの導入～
5.3 3層構造のニューラルネットワーク
5.4 活性化関数の変更
5.5 基本的なニューラルネットワークの導入
5.6 重みの推定方法～勾配降下法と誤差逆伝播法～
5.6.1 勾配降下法
5.6.2 誤差逆伝播法
5.7 Rによるニューラルネットワークの利用
5.8 分類問題とニューラルネットワーク
5.8.1 ロジスティック回帰との比較
5.8.2 分析例
5.9 発展：多層型ネットワーク～ディープラーニングに向けて～
5.10 付録：跳びのあるネットワーク

A 本書の付録

A.1 Rのセットアップ
A.2 階層的クラスタリング
A.2.1 尺度と分類手法
A.2.2 距離の公理
A.2.3 重心法の(4.1)式
A.2.4 ワルド法の(4.2)式
A.2.5 ワルド法による更新(4.3)式
A.3 主成分分析
A.3.1 ラグランジュの未定乗数法のイメージ
A.3.2 主成分導出の一般化

参考文献

索引

著者紹介

Home 〉書籍一覧〉はっきりわかるデータサイエンスと機械学習 ▲ ページトップへ戻る