試験公開中

このエントリーをはてなブックマークに追加

みんなのR 第2版

マイナビ出版

4,160円+税

Rの基礎からモダンなデータ分析までわかりやすく解説

関連サイト

本書の関連ページが用意されています。

内容紹介

統計、線形代数、機械学習―データサイエンスのタスクをこなすのに重宝する「R」。

本書はオープンソースの統計解析ソフトRの解説書です。データサイエンスに興味があるけれども、何からはじめたらよいか迷っている方を対象に、理論的な説明・数式だけでなくRのコードを多く引用して解説していますので、データ分析・ビジュアル化からレポートまで、実際にコードを動かしながら学ぶことができます。

Rのインストール、RStudioの使い方、Rの文法、データハンドリング、グラフィックス、確率分布、基礎統計、回帰、重回帰、一般化線形モデル、モデル評価、オーバーフィッティングを防ぐ方法、クラスタリング、時系列、レポーティングなどを網羅。第2版ではdplyr、purrr、Tidyverse、Caret、RMarkdown、Shinyの章が追加されました。

実務でデータサイエンスを用いビジネスにインパクトを与えたい方、データサイエンティストを抱えている部署のマネジメントの方など、様々な用途で・自分の読み方で活用してもらえればと思います。

書誌情報

  • 著者: Jared P. Lander(著), 高柳慎一, 津田真樹, 牧山幸史, 松村杏子, 簑田高志(訳)
  • 発行日: (紙書籍版発行日: 2018-12-28)
  • 最終更新日: 2018-12-28
  • バージョン: 1.0.0
  • ページ数: 584ページ(PDF版換算)
  • 対応フォーマット: PDF
  • 出版社: マイナビ出版

対象読者

著者について

Jared P. Lander

Jared P. Landar(ジャレド P. ランダー):統計のコンサルティングとトレーニングサービスを専門とするニューヨークに本拠を置くデータサイエンス企業Lander Analyticsのチーフデータサイエンティスト、世界最大規模のR meetup:the New York Open Statistical Programming Meetup とthe New York R Conference の主催者で、コロンビア大学の統計学の非常勤教授。Scott's Pizza Toursのツアーガイド。コロンビア大学で統計の修士号をミューレンバーグ・カレッジで数学の学士号を取得しており、学術研究と産業界両方の経験を持ち合わせている。

高柳慎一

LINE株式会社 Data Labs 所属。材料科学系財団、金融系シンクタンク、リクルート系企業を経て現職。翻訳書 『R言語徹底解説』(共立出版, 2014)、『みんなのR』(マイナビ, 2015)、『Rによる自動データ収集』(共立出版, 2017)など多数。

津田真樹

テクノスデータサイエンス・エンジニアリング株式会社所属。英語と日本語の無料電子ブック『Rcpp for everyone(みんなのRcpp)』の執筆者。共著に『パーフェクトR』(技術評論社)がある。

牧山幸史

ヤフー株式会社にてデータサイエンス業務に従事するかたわら、株式会社ホクソエム代表取締役社長を務める。情報処理学会ビッグデータ解析のビジネス実務利活用研究グループ運営委員会運営委員。共同翻訳書に『Rによる自動データ収集』(共立出版)がある。

松村杏子

Web制作ベンチャー企業を経て、2016年4月ヤフー株式会社に入社。インターネット広告・オークションなどの分析に携わる。学生時代の専門は計量経済学とゲーム理論。

簑田高志

インターネット業界で十年以上に渡りネット広告/Eコマース関連の広告・CRM・サイト分析など、事業を幅広くカバーする業務を行う。近年ではBIツールの構築支援業務を行っている。

目次

翻訳者より

  • 0.1 : はじめに
  • 0.2 : まえがき
  • 0.3 : 第2版への謝辞
  • 0.4 : 第1版への謝辞

1章 Rを手に入れる

  • 1.1 : Rのダウンロード
  • 1.2 : Rのバージョン
  • 1.3 : 32bitと64bit
  • 1.4 : インストール
  • 1.5 : Microsoft R Open
  • 1.6 : まとめ

2章 Rの環境

  • 2.1 : コマンドラインインターフェイス(CLI)
  • 2.2 : RStudio
  • 2.3 : Microsoft Visual Studio
  • 2.4 : まとめ

3章 Rパッケージ

  • 3.1 : インストールパッケージ
  • 3.2 : パッケージのロード
  • 3.3 : パッケージの作成
  • 3.4 : まとめ

4章 Rの基本

  • 4.1 : 基本的な数学
  • 4.2 : 変数
  • 4.3 : データ型
  • 4.4 : ベクトル
  • 4.5 : 関数(Function)の呼び出し
  • 4.6 : 関数ドキュメント
  • 4.7 : 欠損値
  • 4.8 : パイプ
  • 4.9 : まとめ

5章 高度なデータ構造

  • 5.1 : データフレーム(data.frame)
  • 5.2 : リスト(List)
  • 5.3 : マトリックス(Matrix)
  • 5.4 : アレイ(Array)
  • 5.5 : まとめ

6章 Rへのデータ取り込み

  • 6.1 : CSVの読み込み
  • 6.2 : Excelの読み込み
  • 6.3 : データベースからの読み込み
  • 6.4 : 他社統計ツールからの読み込み
  • 6.5 : Rバイナリファイル
  • 6.6 : Rに入っているデータ
  • 6.7 : Webサイトからの抽出
  • 6.8 : Reading JSON Data
  • 6.9 : まとめ

7章 統計グラフ

  • 7.1 : 基本グラフィクス
  • 7.2 : ggplot2
  • 7.3 : まとめ

8章 Rの関数を書く

  • 8.1 : ハロー、ワールド!
  • 8.2 : 関数の引数
  • 8.3 : 値の返却
  • 8.4 : do.call
  • 8.5 : まとめ

9章 コントロール文

  • 9.1 : if とelse
  • 9.2 : switch
  • 9.3 : ifelse
  • 9.4 : 複合テスト
  • 9.5 : まとめ

10章 ループ・Rの方法ではない反復方法

  • 10.1 : for ループ
  • 10.2 : while ループ
  • 10.3 : ループの制御
  • 10.4 : まとめ

11章 グルーピング操作

  • 11.1 : Applyファミリー
  • 11.2 : aggregate
  • 11.3 : plyr
  • 11.4 : data.table
  • 11.5 : まとめ

12章 dplyrによる高速なグルーピング操作

  • 12.1 : パイプ演算子
  • 12.2 : tbl
  • 12.3 : select
  • 12.4 : filter
  • 12.5 : slice
  • 12.6 : mutate
  • 12.7 : summarize
  • 12.8 : group_by
  • 12.9 : arrange
  • 12.10 : do
  • 12.11 : dplyr によるデータベース操作
  • 12.12 : まとめ

13章 purrrによる反復処理

  • 13.1 : map
  • 13.2 : 型を指定するmap
  • 13.3 : data.frame に対する反復処理
  • 13.4 : 複数入力に対するmap
  • 13.5 : まとめ

14章 データ整形

  • 14.1 : cbind とrbind
  • 14.2 : Join
  • 14.3 : reshape2
  • 14.4 : まとめ

15章 Tidyverseでのデータ整形

  • 15.1 : 行や列の結合
  • 15.2 : dplyr を使ったJoin
  • 15.3 : データ形式を変換する
  • 15.4 : まとめ

16章 文字列操作

  • 16.1 : paste
  • 16.2 : sprintf
  • 16.3 : テキストの抽出
  • 16.4 : 正規表現
  • 16.5 : まとめ

17章 確率分布

  • 17.1 : 正規分布
  • 17.2 : 二項分布
  • 17.3 : ポアソン分布
  • 17.4 : その他の分布
  • 17.5 : まとめ

18章 基本統計

  • 18.1 : 要約統計
  • 18.2 : 相関と共分散
  • 18.3 : t検定
  • 18.4 : 分散分析
  • 18.5 : まとめ

19章 線形モデル

  • 19.1 : 単回帰
  • 19.2 : 重回帰
  • 19.3 : まとめ

20章 一般化線形モデル

  • 20.1 : ロジスティック回帰
  • 20.2 : ポアソン回帰
  • 20.3 : その他の一般化線形モデル
  • 20.4 : 生存時間分析
  • 20.5 : まとめ

21章 モデル評価

  • 21.1 : 残差
  • 21.2 : モデル比較
  • 21.3 : クロスバリデーション
  • 21.4 : ブートストラップ
  • 21.5 : ステップワイズ変数選択法
  • 21.6 : まとめ

22章 正則化と縮小( シュリンケージ)

  • 22.1 : Elastic Net
  • 22.2 : Bayesian縮小
  • 22.3 : まとめ

23章 非線形モデル

  • 23.1 : 非線形最小二乗法
  • 23.2 : スプライン
  • 23.3 : 一般化加法モデル
  • 23.4 : 決定木
  • 23.5 : Boosted Trees
  • 23.6 : ランダムフォレスト
  • 23.7 : まとめ

24章 時系列と自己相関

  • 24.1 : 自己回帰移動平均
  • 24.2 : VAR
  • 24.3 : GARCH
  • 24.4 : まとめ

25章 クラスタリング

  • 25.1 : K-means
  • 25.2 : PAM
  • 25.3 : 階層型クラスタリング
  • 25.4 : まとめ

26章 caret を用いたモデルの当てはめ

  • 26.1 : caretの基本
  • 26.2 : caretのオプション
  • 26.3 : ブースティング木をチューニングする
  • 26.4 : まとめ

27章 knitrパッケージによる再現性とレポート

  • 27.1 : LaTeXプログラムのインストール
  • 27.2 : LaTeX 入門
  • 27.3 : LaTeXを使ったknitr
  • 27.4 : まとめ

28章 RMarkdownを用いたリッチなドキュメント

  • 28.1 : ドキュメントのコンパイル
  • 28.2 : ドキュメントのヘッダー
  • 28.3 : マークダウンの基礎
  • 28.4 : マークダウンのコードチャンク
  • 28.5 : htmlwidgets
  • 28.6 : RMarkdownのスライドショー
  • 28.7 : まとめ

29章 Shinyを用いたインタラクティブなダッシュボード

  • 29.1 : RMarkdownにおけるShiny
  • 29.2 : ShinyにおけるReactive Expressions
  • 29.3 : ServerとUI
  • 29.4 : まとめ

30章 Rパッケージの構築

  • 30.1 : フォルダ構成
  • 30.2 : パッケージファイル
  • 30.3 : パッケージドキュメンテーション
  • 30.4 : テスト
  • 30.5 : チェック、構築とインストール
  • 30.6 : CRANへの登録
  • 30.7 : C++コード
  • 30.8 : まとめ

付録A 実生活での情報リソース

  • A.1 : Meetup
  • A.2 : Stack Overflow
  • A.3 : Twitter
  • A.4 : カンファレンス
  • A.5 : Webサイト
  • A.6 :ドキュメント
  • A.7 : 書籍
  • A.8 : まとめ

付録B 用語集

索引

Home 書籍一覧 みんなのR 第2版 ▲ ページトップへ戻る