
関連サイト
本書の関連ページが用意されています。
内容紹介
近年、画像生成技術は急速な進化を遂げ、特に2022年の「Stable Diffusion」公開以降、テキストから画像を生成するAIが広く普及しています。本書はこの革新的な技術の基礎から応用までを網羅し、読者が画像生成を深く理解することを目的としています。第1章では画像生成の概要を学びます。同時に技術の急速な発展に伴う倫理的な課題やリスクについても考察します。第2章では画像生成の基盤となる深層学習の基礎を、現代の主流であるTransformerモデルに焦点を当てて解説します。第3章では生成モデルの概念と、画像生成を飛躍的に進歩させた拡散モデルの基礎理論を解説します。第4章では拡散モデルの進化形である潜在拡散モデルとStable Diffusionについて解説します。第5章では拡散モデルをもとに、画像生成にとどまらないさまざまな応用について紹介します。第6章では画像生成技術の今と未来を考察します。
書誌情報
- 著者: 北田俊輔
- 発行日: 2025-03-25 (紙書籍版発行日: 2025-03-25)
- 最終更新日: 2025-03-25
- バージョン: 1.0.0
- ページ数: 368ページ(PDF版換算)
- 対応フォーマット: PDF, EPUB
- 出版社: インプレス
対象読者
・画像処理のエンジニア・学生 ・AIや機械学習に興味を持ち、画像生成の分野に入門したい人 ・Pythonの基礎知識を持ち、画像生成AIの理論と実践的なスキルを身に付けたい人 ・クリエイティブ産業やデザイン、広告などで画像生成AIを活用したい人
著者について
北田俊輔

LINEヤフー株式会社リサーチサイエンティスト・法政大学大学院特任研究員。2023年3月に法政大学大学院理工学研究科を修了。博士(工学)。日本学術振興会特別研究員(DC2)を経て現職。コンピュータビジョンや自然言語処理を始め、その融合領域であるVision&Language分野にて研究に従事。現在はユーザにとって魅力的な画像やデザインの作成を支援するような最先端技術の研究開発に携わる。
目次
本書の前提
目次
序章
- 第1章 画像生成とは?
- 第1節 画像生成の概要
- 第2節 テキストからの画像生成
- 第3節 画像生成技術の進歩による弊害
- コラム:すべてを救うPythonの型ヒント
第2章 深層学習の基礎知識
- 第1節 深層学習の概要
- 第2節 深層学習の訓練と評価
- 第3節 注意機構とTransformerモデル
- コラム:dataclassで万物に型を付けよう
第3章 拡散モデルの導入
- 第1節 生成モデル
- 第2節 DDPM(ノイズ除去拡散確率モデル)
- 第3節 スコアベース生成モデル
- 第4節 拡散モデルの生成品質の向上
- コラム:Pythonのコードを美しく保つには
第4章 潜在拡散モデルとStable Diffusion
- 第1節 LDM(潜在拡散モデル)
- 第2節 CLIP
- 第3節 Stable Diffusionを構成する要素
- 第4節 Stable Diffusion v1
- 第5節 Stable Diffusion v2
- 第6節 Stable Diffusion XL
- 第7節 Stable Diffusion v3
- コラム:深層学習を用いた実験を再現可能にするために気をつけること
第5章 拡散モデルによる画像生成技術の応用
- 第1節 パーソナライズされた画像生成
- 第2節 制御可能な画像生成
- 第3節 拡散モデルによる画像編集
- 第4節 画像生成モデルの学習および推論の効率化
- 第5節 学習済み拡散モデルの効果的な拡張
- 第6節 生成画像の倫理・公平性
- コラム:diffusersのコードを拡張する
第6章 画像生成の今後
- 第1節 拡散モデルの発展に伴う議論
- 第2節 拡散モデルによる画像生成の倫理
- 第3節 画像生成にとどまらない拡散モデルの進化と今後
- コラム:Hugging Faceのエコシステムを使い倒す