関連サイト
本書の関連ページが用意されています。
内容紹介
統計、線形代数、機械学習―データサイエンスのタスクをこなすのに重宝する「R」。
本書はオープンソースの統計解析ソフトRの解説書です。データサイエンスに興味があるけれども、何からはじめたらよいか迷っている方を対象に、理論的な説明・数式だけでなくRのコードを多く引用して解説していますので、データ分析・ビジュアル化からレポートまで、実際にコードを動かしながら学ぶことができます。
Rのインストール、RStudioの使い方、Rの文法、データハンドリング、グラフィックス、確率分布、基礎統計、回帰、重回帰、一般化線形モデル、モデル評価、オーバーフィッティングを防ぐ方法、クラスタリング、時系列、レポーティングなどを網羅。第2版ではdplyr、purrr、Tidyverse、Caret、RMarkdown、Shinyの章が追加されました。
実務でデータサイエンスを用いビジネスにインパクトを与えたい方、データサイエンティストを抱えている部署のマネジメントの方など、様々な用途で・自分の読み方で活用してもらえればと思います。
書誌情報
- 著者: Jared P. Lander(著), 高柳慎一, 津田真樹, 牧山幸史, 松村杏子, 簑田高志(訳)
- ページ数: 584ページ(PDF版換算)
- 対応フォーマット: PDF
- 出版社: マイナビ出版
対象読者
著者について
Jared P. Lander
Jared P. Landar(ジャレド P. ランダー):統計のコンサルティングとトレーニングサービスを専門とするニューヨークに本拠を置くデータサイエンス企業Lander Analyticsのチーフデータサイエンティスト、世界最大規模のR meetup:the New York Open Statistical Programming Meetup とthe New York R Conference の主催者で、コロンビア大学の統計学の非常勤教授。Scott's Pizza Toursのツアーガイド。コロンビア大学で統計の修士号をミューレンバーグ・カレッジで数学の学士号を取得しており、学術研究と産業界両方の経験を持ち合わせている。
高柳慎一
LINE株式会社 Data Labs 所属。材料科学系財団、金融系シンクタンク、リクルート系企業を経て現職。翻訳書 『R言語徹底解説』(共立出版, 2014)、『みんなのR』(マイナビ, 2015)、『Rによる自動データ収集』(共立出版, 2017)など多数。
津田真樹
テクノスデータサイエンス・エンジニアリング株式会社所属。英語と日本語の無料電子ブック『Rcpp for everyone(みんなのRcpp)』の執筆者。共著に『パーフェクトR』(技術評論社)がある。
牧山幸史
ヤフー株式会社にてデータサイエンス業務に従事するかたわら、株式会社ホクソエム代表取締役社長を務める。情報処理学会ビッグデータ解析のビジネス実務利活用研究グループ運営委員会運営委員。共同翻訳書に『Rによる自動データ収集』(共立出版)がある。
松村杏子
Web制作ベンチャー企業を経て、2016年4月ヤフー株式会社に入社。インターネット広告・オークションなどの分析に携わる。学生時代の専門は計量経済学とゲーム理論。
簑田高志
インターネット業界で十年以上に渡りネット広告/Eコマース関連の広告・CRM・サイト分析など、事業を幅広くカバーする業務を行う。近年ではBIツールの構築支援業務を行っている。
目次
翻訳者より
- 0.1 : はじめに
- 0.2 : まえがき
- 0.3 : 第2版への謝辞
- 0.4 : 第1版への謝辞
1章 Rを手に入れる
- 1.1 : Rのダウンロード
- 1.2 : Rのバージョン
- 1.3 : 32bitと64bit
- 1.4 : インストール
- 1.5 : Microsoft R Open
- 1.6 : まとめ
2章 Rの環境
- 2.1 : コマンドラインインターフェイス(CLI)
- 2.2 : RStudio
- 2.3 : Microsoft Visual Studio
- 2.4 : まとめ
3章 Rパッケージ
- 3.1 : インストールパッケージ
- 3.2 : パッケージのロード
- 3.3 : パッケージの作成
- 3.4 : まとめ
4章 Rの基本
- 4.1 : 基本的な数学
- 4.2 : 変数
- 4.3 : データ型
- 4.4 : ベクトル
- 4.5 : 関数(Function)の呼び出し
- 4.6 : 関数ドキュメント
- 4.7 : 欠損値
- 4.8 : パイプ
- 4.9 : まとめ
5章 高度なデータ構造
- 5.1 : データフレーム(data.frame)
- 5.2 : リスト(List)
- 5.3 : マトリックス(Matrix)
- 5.4 : アレイ(Array)
- 5.5 : まとめ
6章 Rへのデータ取り込み
- 6.1 : CSVの読み込み
- 6.2 : Excelの読み込み
- 6.3 : データベースからの読み込み
- 6.4 : 他社統計ツールからの読み込み
- 6.5 : Rバイナリファイル
- 6.6 : Rに入っているデータ
- 6.7 : Webサイトからの抽出
- 6.8 : Reading JSON Data
- 6.9 : まとめ
7章 統計グラフ
- 7.1 : 基本グラフィクス
- 7.2 : ggplot2
- 7.3 : まとめ
8章 Rの関数を書く
- 8.1 : ハロー、ワールド!
- 8.2 : 関数の引数
- 8.3 : 値の返却
- 8.4 : do.call
- 8.5 : まとめ
9章 コントロール文
- 9.1 : if とelse
- 9.2 : switch
- 9.3 : ifelse
- 9.4 : 複合テスト
- 9.5 : まとめ
10章 ループ・Rの方法ではない反復方法
- 10.1 : for ループ
- 10.2 : while ループ
- 10.3 : ループの制御
- 10.4 : まとめ
11章 グルーピング操作
- 11.1 : Applyファミリー
- 11.2 : aggregate
- 11.3 : plyr
- 11.4 : data.table
- 11.5 : まとめ
12章 dplyrによる高速なグルーピング操作
- 12.1 : パイプ演算子
- 12.2 : tbl
- 12.3 : select
- 12.4 : filter
- 12.5 : slice
- 12.6 : mutate
- 12.7 : summarize
- 12.8 : group_by
- 12.9 : arrange
- 12.10 : do
- 12.11 : dplyr によるデータベース操作
- 12.12 : まとめ
13章 purrrによる反復処理
- 13.1 : map
- 13.2 : 型を指定するmap
- 13.3 : data.frame に対する反復処理
- 13.4 : 複数入力に対するmap
- 13.5 : まとめ
14章 データ整形
- 14.1 : cbind とrbind
- 14.2 : Join
- 14.3 : reshape2
- 14.4 : まとめ
15章 Tidyverseでのデータ整形
- 15.1 : 行や列の結合
- 15.2 : dplyr を使ったJoin
- 15.3 : データ形式を変換する
- 15.4 : まとめ
16章 文字列操作
- 16.1 : paste
- 16.2 : sprintf
- 16.3 : テキストの抽出
- 16.4 : 正規表現
- 16.5 : まとめ
17章 確率分布
- 17.1 : 正規分布
- 17.2 : 二項分布
- 17.3 : ポアソン分布
- 17.4 : その他の分布
- 17.5 : まとめ
18章 基本統計
- 18.1 : 要約統計
- 18.2 : 相関と共分散
- 18.3 : t検定
- 18.4 : 分散分析
- 18.5 : まとめ
19章 線形モデル
- 19.1 : 単回帰
- 19.2 : 重回帰
- 19.3 : まとめ
20章 一般化線形モデル
- 20.1 : ロジスティック回帰
- 20.2 : ポアソン回帰
- 20.3 : その他の一般化線形モデル
- 20.4 : 生存時間分析
- 20.5 : まとめ
21章 モデル評価
- 21.1 : 残差
- 21.2 : モデル比較
- 21.3 : クロスバリデーション
- 21.4 : ブートストラップ
- 21.5 : ステップワイズ変数選択法
- 21.6 : まとめ
22章 正則化と縮小( シュリンケージ)
- 22.1 : Elastic Net
- 22.2 : Bayesian縮小
- 22.3 : まとめ
23章 非線形モデル
- 23.1 : 非線形最小二乗法
- 23.2 : スプライン
- 23.3 : 一般化加法モデル
- 23.4 : 決定木
- 23.5 : Boosted Trees
- 23.6 : ランダムフォレスト
- 23.7 : まとめ
24章 時系列と自己相関
- 24.1 : 自己回帰移動平均
- 24.2 : VAR
- 24.3 : GARCH
- 24.4 : まとめ
25章 クラスタリング
- 25.1 : K-means
- 25.2 : PAM
- 25.3 : 階層型クラスタリング
- 25.4 : まとめ
26章 caret を用いたモデルの当てはめ
- 26.1 : caretの基本
- 26.2 : caretのオプション
- 26.3 : ブースティング木をチューニングする
- 26.4 : まとめ
27章 knitrパッケージによる再現性とレポート
- 27.1 : LaTeXプログラムのインストール
- 27.2 : LaTeX 入門
- 27.3 : LaTeXを使ったknitr
- 27.4 : まとめ
28章 RMarkdownを用いたリッチなドキュメント
- 28.1 : ドキュメントのコンパイル
- 28.2 : ドキュメントのヘッダー
- 28.3 : マークダウンの基礎
- 28.4 : マークダウンのコードチャンク
- 28.5 : htmlwidgets
- 28.6 : RMarkdownのスライドショー
- 28.7 : まとめ
29章 Shinyを用いたインタラクティブなダッシュボード
- 29.1 : RMarkdownにおけるShiny
- 29.2 : ShinyにおけるReactive Expressions
- 29.3 : ServerとUI
- 29.4 : まとめ
30章 Rパッケージの構築
- 30.1 : フォルダ構成
- 30.2 : パッケージファイル
- 30.3 : パッケージドキュメンテーション
- 30.4 : テスト
- 30.5 : チェック、構築とインストール
- 30.6 : CRANへの登録
- 30.7 : C++コード
- 30.8 : まとめ
付録A 実生活での情報リソース
- A.1 : Meetup
- A.2 : Stack Overflow
- A.3 : Twitter
- A.4 : カンファレンス
- A.5 : Webサイト
- A.6 :ドキュメント
- A.7 : 書籍
- A.8 : まとめ