関連サイト
本書の関連ページが用意されています。
内容紹介
数多の「ディープラーニング」解説書で概念は理解できたが、さて実際使うには何から始めてよいのか——
本書は、そのような悩みを持つ実務者・技術者に向け、画像認識を中心に「ディープラーニングを実務に活かす技」を解説しています。
すでに世界で標準的に使われているディープラーニング用フレームワークであるKeras(Python)、Torch(Lua)、そして日本で開発が進められているChainerを、そのインストールや実際の使用方法についてはもとより、必要な機材・マシンスペックまでも解説していますので、本書をなぞるだけで実務に応用できます。
書誌情報
- 著者: 株式会社フォワードネットワーク(監修), 藤田一弥, 高原歩(著)
- 発行日: 2016-11-30 (紙書籍版発行日: 2016-11-30)
- 最終更新日: 2016-11-30
- バージョン: 1.0.0
- ページ数: ページ(PDF版換算)
- 対応フォーマット: PDF
- 出版社: オーム社
対象読者
ディープラーニングに興味があるが、実際に何から始めてよいかわからない実務者や技術者、学生
著者について
株式会社フォワードネットワーク
2004年4月設立。ビッグデータの蓄積・解析業務を中核とし、ウェブサイトの応答レスポンスやセキュリティ等の品質向上の支援を行う。2015年4月より、「センサー」「Android 端末」「Hadoop」を組み合わせることで、センサーデータの収集から解析までをトータルにカバーした『IoTセンサー解析ベースシステム』の提供を開始。
■ URL http://www.fward.net/
■ 主サービス Hadoop関連システム構築/WEBサイトの速度・脆弱性等の品質向上支援/ビッグデータ・非構造化データの蓄積・解析/各種統計解析(基本統計、検定、多変量解析、機械学習、ベイズ統計)/業務アプリケーション開発・保守
■ ビッグデータ関連資格 Cloudera Apache Hadoop 認定開発者(CCDH)、Cloudera Apache Hadoop 認定管理者(CCAH)
藤田一弥
新潟県に生まれ、新潟大学教育学部数学科卒業後、新潟県公立中学校数学教員。その後、IT系システム会社に勤務し、Webシステムの開発、および官公庁等の統計業務等に従事。2004 年に株式会社フォワードネットワークを設立。代表取締役。
高原歩
横浜商科大学商学部を卒業後、大手IT会社を経て株式会社フォワードネットワークに入社。Hadoop認定開発者(CCDH)、Hadoop認定管理者(CCAH)等の資格を保持し、ビッグデータ解析等の業務に従事。
目次
はじめに
第1章 本書の概要と準備
- 1.1 本書の概要
- 1.1.1 ディープラーニングの成果
- 1.1.2 本書で学習する内容―画像のクラス分類、物体検出、強化学習
- 1.1.3 本書で扱う手法―学習済みモデルの利用
- 1.2 使用するデータセット
- 1.3 使用する機材とソフトウェア
- 1.3.1 使用するフレームワーク
- 1.3.2 GPUの利用
- 1.3.3 使用機材―ゲーム用パソコンを転用
- 1.3.4 OSおよびミドルウェア
- 1.4 ソフトウェアのインストール
- 1.4.1 OSのインストール
- 1.4.2 ミドルウェアのインストール
- 1.5 プログラムのダウンロード
- 1.5.1 ダウンロードファイル
- 1.5.2 ダウンロードファイルの解凍
第2章 ネットワークの構成
- 2.1 順伝播型ネットワーク
- 2.1.1 全結合ニューラルネットワーク
- 2.1.2 畳み込みニューラルネットワーク
- 2.2 畳み込みニューラルネットワーク
- 2.2.1 畳み込み層
- 2.2.2 プーリング層
- 2.2.3 アップサンプリング層
- 2.3 本書で使用するネットワークのパターン
第3章 基本用語
- 3.1 ディープラーニングの処理概要
- 3.2 活性化関数
- 3.3 損失関数
- 3.4 確率的勾配降下法
- 3.4.1 重み更新の計算例
- 3.4.2 モメンタム
- 3.5 誤差逆伝播法
- 3.6 過学習
- 3.6.1 バリデーションデータセットを使ったエポック数の決定
- 3.6.2 正則化
- 3.6.3 ドロップアウト
- 3.7 データ拡張と前処理
- 3.8 学習済みモデル
- 3.9 学習係数の調整
第4章 画像のクラス分類
- 4.1 概要
- 4.2 共通データの作成
- 4.2.1 画像データセットのダウンロード
- 4.2.2 データの抽出と基本データセットの作成
- 4.2.3 データ拡張と共通データセットの作成
- 4.3 9層のネットワークでクラス分類
- 4.3.1 ネットワークの概要
- 4.3.2 学習とモデルの作成
- 4.3.3 モデルの読み込みと推測の実行
- 4.3.4 実行例
- 4.4 VGG-16でクラス分類―16層の学習済みモデル
- 4.4.1 VGG-16の概要
- 4.4.2 プログラムの概要.
- 4.4.3 実行例
- 4.5 ResNet-152でクラス分類―152層の学習済みモデル
- 4.5.1 ResNetの概要
- 4.5.2 実行環境のインストール
- 4.5.3 プログラムの概要
- 4.5.4 実行例
- 4.6 推測精度のさらなる向上
- 4.6.1 概要
- 4.6.2 複数モデルの利用
- 4.6.3 Stacked Generalization
- 4.6.4 Self Training
第5章 物体検出
- 5.1 物体の位置を検出―26層のネットワーク
- 5.1.1 物体の位置・大きさ・種類の推測
- 5.1.2 使用するソフトウェアとその特徴
- 5.1.3 実行環境のインストール
- 5.1.4 学習済みモデルを用いて物体検出
- 5.1.5 オブジェクトを学習して物体検出
- 5.2 物体の形状を検出―23層のネットワーク
- 5.2.1 物体の位置・大きさ・形状の推測
- 5.2.2 使用するモデルとその特徴
- 5.2.3 プログラムの概要
- 5.2.4 実行例
第6章 強化学習―三目並べに強いコンピュータを育てる
- 6.1 強化学習
- 6.1.1 強化学習とは
- 6.1.2 Q学習
- 6.1.3 DQN
- 6.2 基本的な枠組み
- 6.2.1 環境とエージェント
- 6.2.2 処理の概要
- 6.2.3 環境内のルール
- 6.3 実行環境のインストール
- 6.4 Q学習とディープラーニング
- 6.5 実行例
付録
付録A Yolo用「オブジェクトの位置情報」の作成方法
- A.1 BBox-Label-Toolのインストール
- A.2 「オブジェクトの位置情報」の作成
付録B ソースリスト
COLUMN
- 全結合層と畳み込み層の違い
- 勾配消失問題とReLU
- VGG-16の作成経緯
- ベイズと半教師あり学習