販売終了

囲碁ディープラーニングプログラミング

Max Pumperla, Kevin Ferguson(著), 山岡忠夫(訳)

マイナビ出版

3,608円 (3,280円+税)

販売終了 Pythonによる囲碁AIボット開発からAlphaGo実装までわかりやすく解説！

内容紹介

ボードゲームを題材とした古典的なAIの実装からはじめ、深層学習と強化学習を囲碁AIに組み込み、改良していきます。囲碁ボット構築の方法を理解することで、他の人工知能開発にも応用することができるようになります。

Manning Publications『Deep Learning and the Game of Go』の日本語版。

・PythonとKerasを利用した囲碁AIボット開発でディープラーニングを深く理解できます。
・AlphaGo/AlphaGo Zeroで用いられた手法も解説！
・基本的なPythonと高校レベルの数学の知識で読破可能。

この本はAlphaGoの開発と拡張という魅惑的な冒険へ導いてくれます。あなたは最も美しくかつ挑戦的なゲーム開発の基礎を学ぶことになるでしょう。とても読みやすく魅力に溢れた人工知能と機械学習の実践的入門書です。

― Thore Graepel：DeepMind AlphaGoチームの研究・開発者（本書まえがきより）

書誌情報

著者: Max Pumperla, Kevin Ferguson(著), 山岡忠夫(訳)
ページ数: 448ページ(PDF版換算)
対応フォーマット: PDF
出版社: マイナビ出版

対象読者

著者について

Max Pumperla

skymind.aiの深層学習専門のデータサイエンティスト。深層学習プラットフォームaetros.comの共同創設者。MaxとKevinは共同で、オープンソースの囲碁ボット「BetaGo」をPythonで開発した。

Kevin Ferguson

Honorのデータサイエンティスト。GoogleやMeeboなどの企業での経験もある。

山岡忠夫

東京工業大学工学部電子物理工学科卒業。システムエンジニア。『将棋AIで学ぶディープラーニング』著者。AlphaGoでディープラーニングに興味を持ち将棋ソフト「dlshogi」を開発中。

5.1 簡単な事例：手書き数字の分類
5.2 ニューラルネットワークの基礎
5.3 順伝播型ネットワーク
5.4 予測精度はどれくらいか？損失関数と最適化
5.5 Pythonを使いニューラルネットワークをステップバイステップで訓練する
5.6 まとめ

第6章囲碁データのためのニューラルネットワークの設計

6.1 ニューラルネットワークのための局面エンコーディング
6.2 木探索によるネットワークの訓練データの生成
6.3 深層学習ライブラリKeras
6.4 畳み込みネットワークによる空間解析
6.5 囲碁の着手確率の予測
6.6 ドロップアウトおよび正規化線形関数を使った、より深いネットワークの構築
6.7 より強力な着手予測ネットワークのためすべてをまとめる
6.8 まとめ

第7章データからの学習：深層学習ボット

7.1 囲碁の棋譜のインポート
7.2 深層学習のための囲碁データの準備
7.3 人間の対局データによる深層学習モデルの訓練
7.4 より現実的な囲碁データエンコーダの構築
7.5 適応的勾配による効率的な訓練
7.6 独自の実験の実行とパフォーマンスの評価
7.7 まとめ

第8章ボットの公開

8.1 深層ニューラルネットワークによる着手予測エージェントの作成
8.2 囲碁ボットのウェブフロントエンドへの提供
8.3 囲碁ボットのクラウドへの配置と訓練
8.4 他のボットとの対話：Go Text Protocol (GTP)
8.5 ローカルで他のボットと対局
8.6 オンライン囲碁サーバへの囲碁ボットの配置
8.7 まとめ

第9章練習による学習：強化学習

9.1 強化学習サイクル
9.2 何が経験になるか
9.3 学習可能なエージェントの構築
9.4 自己対局：コンピュータプログラムの練習方法
9.5 まとめ

第10章方策勾配による強化学習

10.1 ランダムなゲームでどのようにして良い決定を行うことができるか
10.2 勾配降下法によるニューラルネットワーク方策の更新
10.3 自己対局による訓練のためのヒント
10.4 まとめ

第11章価値に基づく強化学習

11.1 Q学習を使用したゲームプレイ
11.2 KerasによるQ学習
11.3 まとめ

第12章 actor-critic法による強化学習

12.1 アドバンテージはどの決定が重要かを教える
12.2 actor-criticによる学習のためのニューラルネットワークの設計
12.3 actor-criticによるゲームプレイ
12.4 経験データからactor-criticエージェントを訓練する
12.5 まとめ

■ 第III部：“全体は部分の総和に勝る”

第13章 AlphaGo：すべてをまとめる

13.1 AlphaGoのための深層ニューラルネットワークの訓練
13.2 方策ネットワークからの自己対局のブートストラップ
13.3 自己対局データから価値ネットワークを導く
13.4 方策と価値ネットワークによるより良い探索
13.5 自作AlphaGoを訓練するための実践的考察
13.6 まとめ

第14章 AlphaGo Zero：強化学習と木探索の統合

14.1 木探索のためのニューラルネットワークの構築
14.2 ニューラルネットワークによる木探索のガイド
14.3 訓練
14.4 ディリクレノイズによる探索の改善
14.5 より深いニューラルネットワークのための最新のテクニック
14.6 追加の資料の探索
14.7 総仕上げ
14.8 まとめ

■ 付録

付録A 数学の基礎
付録B 誤差逆伝播法
付録C 囲碁プログラムとサーバ
付録D Amazon Web Servicesを使用したボットの訓練とデプロイ
付録E Online Go Serverへのボットの提出

索引

謝辞

著者紹介

Home 〉書籍一覧〉囲碁ディープラーニングプログラミング ▲ ページトップへ戻る

囲碁ディープラーニングプログラミング

関連サイト

内容紹介

書誌情報