関連サイト
本書の関連ページが用意されています。
内容紹介
近年の技術の発展により、画像認識技術はますます身近になっています。スマホの顔認証やオンライン会議での人物と背景を認識して背景をぼかすなどをはじめ、画像認識技術ははさまざまな場面において人々の生活をサポートしています。本書では画像認識について実践的に学べるように、Pythonを使った実装を示しています。また画像認識の基礎については簡単に触れるにとどめ、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。
書誌情報
- 著者: 田村雅人, 中村克行
- 発行日: 2023-03-22 (紙書籍版発行日: 2023-03-22)
- 最終更新日: 2023-03-22
- バージョン: 1.0.0
- ページ数: 352ページ(PDF版換算)
- 対応フォーマット: PDF, EPUB
- 出版社: インプレス
対象読者
・画像処理のエンジニアや研究者 ・理系の大学生 ・Pythonで画像処理を実装したい人
著者について
田村雅人
2016年に東京大学大学院工学系研究科修士課程を修了し、(株)日立製作所に入社。パブリックセーフティ向け映像認識技術の研究開発に従事し、人物検出や追跡、人と物体の関係性検出など、映像監視に使われるAI技術を開発。2021年よりアメリカ・シリコンバレーにオフィスをおくHitachi America, Ltd.に出向し、世界トップレベルの研究者たちと映像認識技術の開発に従事。
中村克行
2007年 東京大学大学院 新領域創成科学研究科 博士課程修了。同年、(株)日立製作所 中央研究所入社。物体追跡、一人称視点映像解析、マルチモーダル認識などの研究開発に従事し、2022年より同社研究開発グループ 先端AIイノベーションセンタ 知能ビジョン研究部長。2015-2016年 スタンフォード大学コンピュータサイエンス学科 客員研究員。2005年 FIT ヤングリサーチャー賞、2011年 IEEE Consumer Electronics Society Best Paper Award in Television Technologyなど受賞。
目次
序章
第1章 画像認識とは?
- 第1節 画像認識の概要
- 第2節 コンピュータによる画像認識の仕組みを理解しよう
- 第3節 実社会で使われている画像認識アプリケーション
- 第4節 画像認識のための開発環境構築
- コラム:画像認識とクラウドサービス
第2章 画像処理の基礎知識
- 第1節 画像データを読み込んで表示してみよう
- 第2節 画像に平滑化フィルタをかけてみよう
- 第3節 畳み込み演算を使った特徴抽出
- 第4節 アテンションを使った特徴抽出
- コラム:海外で働くことをめざす方へ
第3章 深層学習を使う準備
- 第1節 学習と評価の基礎
- 第2節 深層ニューラルネットワーク
- コラム:AIとエネルギー問題
第4章 画像分類
- 第1節 順伝播型ニューラルネットワークによる手法
- 第2節 畳み込みニューラルネットワークによる手法—ResNet18を実装してみよう
- 第3節 Transformerによる手法—Vision Transformerを実装してみよう
- 第4節 精度向上のテクニック
- コラム:見えるメリットとデメリット
第5章 物体検出
- 第1節 物体検出の基礎
- 第2節 データセットの準備
- 第3節 CNNによる手法—RetinaNetを実装してみよう
- 第4節 Transformerによる手法—DETRを実装してみよう
- コラム:画像生成AI
第6章 画像キャプショニング
- 第1節 画像キャプショニングの基礎
- 第2節 データセットの準備
- 第3節 CNN-LSTMによる手法—Show and tellを実装してみよう
- 第4節 アテンション機構による手法—Show, attend and tellを実装してみよう
- 第5節 Transformerによる画像キャプショニングを実装してみよう
- コラム:スタンフォード大学のコンピュータビジョン研究者養成術