試験公開中

機械学習 100+ページ エッセンス
販売終了
このエントリーをはてなブックマークに追加

機械学習 100+ページ エッセンス

インプレス

3,850円 (3,500円+税)

販売終了 AIエキスパートの知見から新たな視点を得る! 理論と現場を橋渡しする、機械学習の実践的エッセンス―数式をどう読み解くか。各手法がどこまで活用できるか。問題をどう乗り越えるか―アルゴリズムの考え方や数式、特徴、利用条件、長短、活用範囲などを解説。

【注意】本書のEPUB版は固定レイアウト型になっております。文字の大きさの変更や検索、引用などはお使いいただけません。画面の大きい端末でご利用ください。

関連サイト

本書の関連ページが用意されています。

内容紹介

AIエキスパートの知見から得る、新たな視点! 理論と現場を橋渡しする、機械学習の実践的エッセンス。数式をどう読み解くか。各手法がどこまで活用できるか。問題をどう乗り越えるか。米国で大ブレークの機械学習本を翻訳。

機械学習アルゴリズムにおける考え方や数式を示し、アルゴリズムの特徴、利用条件、長所/短所、活用範囲などを解説。一気に読める量でありながらも、主要な手法を網羅。著者は、人工知能分野で博士号を取得、その後は企業で実装を続けています。本書では、そうして積み重ねた知見を展開。現実問題に取り組むための知識が得られる貴重な一冊です。

数学や統計学、プログラミングについてあまり高度な知識や経験を求めていませんが取り上げている手法に時間を費して学べる人なら、かなり読み進められるはずです。機械学習を学ぶ機会を探している初学者にも、すでに実務に携わっていてより知識を広げたい熟練者にも適しています。この分野でPh.D論文の研究をこれから始めようという人にはきっと本書が必要で、研究が進むにつれて有用な参考書となるでしょう。

◎本書は『The Hundred-Page Machine Learning Book』の翻訳書です。数学など一定の知識が前提となっています。

書誌情報

  • 著者: Andriy Burkov(著), 清水美樹(訳)
  • ページ数: 192ページ(PDF版換算)
  • 対応フォーマット: PDF, EPUB
  • 出版社: インプレス

対象読者

データサイエンティスト、データアナリスト、プログラマー。データ分析や機械学習にかかわるIT技術者や研究者/学生。

著者について

Andriy Burkov

カナダのラヴァル大学にて人工知能分野で博士号を取得。2015年より、IT調査会社ガートナーで機械学習開発チームのリーダーを務める。著者の専門は自然言語処理。所属するチームは、シャローラーニングとディープラーニングの両方の技術を利用して、最先端の多言語テキスト抽出および正規化システムの構築に取り組んでいる。

清水美樹

プログラミングをメインテーマとするフリーライター。東北大学大学院修了後、同学助手を5年間務める。大学での専門は鉱物処理、コロイド工学だったが、プログラミングの楽しさに魅せられて現在に至る。

目次

巻頭言

はじめに

目次

第1章 イントロダクション

  • 1.1 機械学習とは何か
  • 1.2 機械学習の方式
  • 1.2.1 教師あり学習
  • 1.2.2 教師なし学習
  • 1.2.3 半教師あり学習
  • 1.2.4 強化学習
  • 1.3 教師あり学習の仕組み
  • 1.4 モデルが新しいデータに対しても機能する理由

第2章 数学の表記と定義

  • 2.1 表記
  • 2.1.1 データの構造
  • 2.1.2 シグマの大文字表記
  • 2.1.3 パイの大文字表記
  • 2.1.4 集合に対する演算
  • 2.1.5 ベクトルに対する演算
  • 2.1.6 関数
  • 2.1.7 最大値と Arg Max
  • 2.1.8 代入演算子
  • 2.1.9 導関数と勾配
  • 2.2 確率変数
  • 2.3 不偏推定量
  • 2.4 ベイズ則
  • 2.5 パラメータの推定
  • 2.6 パラメータか、ハイパーパラメータか
  • 2.7 分類か、回帰か
  • 2.8 モデルベース学習か、インスタンスベース学習か
  • 2.9 浅い学習か、深層学習か

第3章 基本のアルゴリズム

  • 3.1 線形回帰
  • 3.1.1 問題設定
  • 3.1.2 解法
  • 3.2 ロジスティック回帰
  • 3.2.1 問題設定
  • 3.2.2 解法
  • 3.3 決定木学習
  • 3.3.1 問題設定
  • 3.3.2 解法
  • 3.4 サポートベクトルマシン
  • 3.4.1 ノイズを扱う
  • 3.4.2 非線形の性質のある分布を扱う
  • 3.5 k 近傍法

第4章 学習アルゴリズムの解剖

  • 4.1 学習アルゴリズムの構成要素
  • 4.2 勾配降下法
  • 4.3 機械学習エンジニアのする仕事
  • 4.4 各学習アルゴリズムの特徴

第5章 機械学習の実践[基本編]

  • 5.1 特徴量エンジニアリング
  • 5.1.1 one-hot エンコーディング
  • 5.1.2 ビニング
  • 5.1.3 正規化
  • 5.1.4 標準化
  • 5.1.5 データの欠損を扱う
  • 5.1.6 データ補完法
  • 5.2 学習アルゴリズムの選択
  • 5.3 3 つのデータセット
  • 5.4 学習不足と過学習
  • 5.5 正則化
  • 5.6 モデルの性能を評価する
  • 5.6.1 混同行列
  • 5.6.2 適合率と再現率
  • 5.6.3 正解率
  • 5.6.4 コスト考慮型正解率
  • 5.6.5 ROC 曲線下部面積(AUC)
  • 5.7 ハイパーパラメータのチューニング
  • 5.7.1 交差検証

第6章 ニューラルネットワークとディープラーニング

  • 6.1 ニューラルネットワーク
  • 6.1.1 多層パーセプトロンの例
  • 6.1.2 フィードフォワードニューラルネットワークの構造
  • 6.2 ディープラーニング
  • 6.2.1 畳み込みニューラルネットワーク
  • 6.2.2 リカレントニューラルネットワーク

第7章 問題と解決策

  • 7.1 カーネル回帰
  • 7.2 多クラス分類
  • 7.3 1 クラス分類
  • 7.4 複数ラベルの分類
  • 7.5 アンサンブル学習
  • 7.5.1 ブースティングとバギング
  • 7.5.2 ランダムフォレスト
  • 7.5.3 勾配ブースティング
  • 7.6 シーケンスへのラベル付け学習
  • 7.7 シーケンス間学習
  • 7.8 能動学習
  • 7.9 半教師あり学習
  • 7.10 ワンショット学習
  • 7.11 ゼロショット学習

第8章 機械学習の実践[高度編]

  • 8.1 バランスの悪いデータセットを扱う
  • 8.2 モデルの組み合わせ
  • 8.3 ニューラルネットワークの訓練
  • 8.4 高度な正則化
  • 8.5 複数の入力を扱う
  • 8.6 複数の出力を扱う
  • 8.7 転移学習
  • 8.8 アルゴリズムの効率

第9章 教師なし学習

  • 9.1 密度推定
  • 9.2 クラスタ分析
  • 9.2.1 k 平均法
  • 9.2.2 DBSCAN と HDBSCAN
  • 9.2.3 クラスタの数を決定するには
  • 9.2.4 その他のクラスタ分析アルゴリズム
  • 9.3 次元削減
  • 9.3.1 主成分分析
  • 9.3.2 UMAP.
  • 9.4 外れ値検出

第10章 その他の学習方法

  • 10.1 距離学習
  • 10.2 ランキング学習
  • 10.3 レコメンド学習
  • 10.3.1 因数分解機
  • 10.3.2 ノイズ除去オートエンコーダ
  • 10.4 自己教師あり学習:単語埋め込み

第11章 終わりに

  • 11.1 本書に書けなかったこと
  • 11.1.1 トピックモデリング
  • 11.1.2 ガウス過程
  • 11.1.3 一般化線形モデル
  • 11.1.4 確率的グラフィカルモデル
  • 11.1.5 マルコフ連鎖モンテカルロ法
  • 11.1.6 敵対的生成ネットワーク
  • 11.1.7 遺伝的アルゴリズム
  • 11.1.8 強化学習
  • 11.2 謝辞

用語集

索引

Home 書籍一覧 機械学習 100+ページ エッセンス ▲ ページトップへ戻る