全容解説GPT テキスト生成AIプロダクト構築への第一歩
2,750円 (2,500円+税)
【注意】本書のEPUB版は固定レイアウト型になっております。文字の大きさの変更や検索、引用などはお使いいただけません。画面の大きい端末でご利用ください。
関連サイト
本書の関連ページが用意されています。
内容紹介
大規模言語モデルGPTの全体像を把握できる! ChatGPTの実行例やOpenAI API活用の基本コード、市場動向も解説。最新情報を加筆し、GPT-3.5/4に対応。
>>これから知りたい人のためのGPT/Open APIスタートガイド<< GPT/Open APIを利用する前に押さえておきたい基礎知識を確認できる一冊!
本書のテーマは、大きく2つに分かれています。1つはGPTの技術的な基本事項、もう1つはGPT拡大期の市場動向です。
本書の前半は、まず大規模言語モデルが登場した背景を確認し、さらにGPT/OpenAI APIの技術要素の概要、これまでの経緯などを説明します。
この後、ChatGPTの章では、テキスト分類、固有表現認識、文章要約、テキスト生成の例を紹介。OpenAI APIの章では、モデル選択、パラメータ調整、追加トレーニングなどを確認し、さらにPythonやNode.js、Go言語による基本的な実装コードを見ていきます。
本書の後半は、GPT拡大期における、GPTのスタートアップ企業の事例、グローバル企業の動向を取り上げます。そして最後に、GPTのリスクと今後の動向について展望します。
「この本は、GPT言語モデルを理解し、OpenAI API上でアプリケーションを構築する方法を学びたい実務者や開発者にとって、完璧な出発点となるものだ」──Peter Welinder(OpenAIプロダクト&パートナーシップ担当副社長)
書誌情報
- 著者: Sandra Kublik, Shubham Saboo(著), 武舎 広幸(訳)
- 発行日: 2023-12-12 (紙書籍版発行日: 2023-12-12)
- 最終更新日: 2023-12-12
- バージョン: 1.0.0
- ページ数: 200ページ(PDF版換算)
- 対応フォーマット: PDF, EPUB
- 出版社: インプレス
対象読者
テキスト生成AIの基礎知識を知りたい方 テキスト生成AIの使い方の基本を知りたい方
著者について
Sandra Kublik
起業家、エバンジェリスト、コミュニティビルダーとして、AIビジネスのイノベーションに関わる仕事に従事している。複数のAI企業のメンター兼コーチであり、スタートアップ企業向けAIアクセラレーションプログラムおよびAIハッカソンコミュニティDeep Learning Labsの共同設立者。自然言語処理や生成AIをテーマにした講演者としても活躍中。YouTubeチャンネルを運営し、AI関係者へのインタビューや、画期的なAIトレンドについて、楽しくかつ興味深いコンテンツを提供している。
Shubham Saboo
世界中の著名企業で、データサイエンティストからAIエバンジェリストまで、さまざまな職務に従事し、データサイエンスや機械学習のプロジェクトに立ち上げ時から参画し、組織全体のデータ戦略や技術インフラの構築を行う。AIエバンジェリストとして、人工知能という急成長分野でアイデアを交換するためのコミュニティを構築している。新しいことを学び、コミュニティとの知識共有を促進するため、AIの進歩とその経済的影響に関する技術ブログを執筆中。余暇には各地を旅行し、異文化に触れ、その経験をもとに自分の世界観に磨きをかけている。
武舎 広幸
国際基督教大学、山梨大学大学院、リソースシェアリング株式会社、オハイオ州立大学大学院、カーネギーメロン大学機械翻訳センター客員研究員等を経て、東京工業大学大学院博士後期課程修了。マーリンアームズ株式会社(www.marlin-arms.co.jp)代表取締役。主に自然言語処理関連ソフトウェアの開発、コンピュータや自然科学関連の翻訳、プログラミング講座や辞書サイト(www.dictjuggler.net)の運営などを手がける。www.musha.comに翻訳者のウェブページを公開。
目次
まえがき
- 謝辞
第1章 大規模言語モデルの革命
- 1.1 自然言語処理とは?
- 1.2 大規模化による超進歩
- 1.3 GPTの名前の由来
- 1.3.1 Generative(生成的な)
- 1.3.2 Pre-trained(事前学習済みの)
- 1.3.3 Transformer(トランスフォーマ)
- 1.3.4 Seq2Seq
- 1.4 Transformerのアテンションメカニズム
- 1.5 GPTの歴史
- 1.5.1 GPT-1
- 1.5.2 GPT-2
- 1.5.3 GPT-3
- 1.5.4 ChatGPT
- 1.5.5 GPT-4
- 1.6 OpenAI API公開のビジネス界への影響
- 1.7 OpenAI APIの利用
第2章 ChatGPTの4つの実行例
- 2.1 ChatGPTの実行
- 2.2 プロンプトとコンプリーション
- 2.3 標準的なNLPタスクのパフォーマンス
- 2.3.1 テキスト分類
- 2.3.2 固有表現認識(Named Entity Recognition)
- 2.3.3 文章要約
- 2.3.4 テキスト生成
- 2.4 プロンプトエンジニアリングとデザイン
- 2.5 この章のまとめ
第3章 OpenAI APIの機能と活用
- 3.1 Playgroundの概要
- 3.1.1 Playgroundの起動
- 3.1.2 ChatGPTをまねる
- 3.1.3 SYSTEMの設定
- 3.2 パラメータの設定
- 3.2.1 [Mode]
- 3.2.2 [Model]
- 3.2.3 [Temperature]と[Top P]
- 3.2.4 [Maximum length]
- 3.2.5 [Stop sequences]
- 3.2.6 [Frequency penalty]と[Presence penalty]
- 3.3 APIの呼び出し
- 3.3.1 APIキーの取得
- 3.4 トークンとコスト
- 3.4.1 トークン
- 3.4.2 コスト
- 3.4.3 ダッシュボード
- 3.5 Pythonを使った呼び出し
- 3.5.1 公式Pythonバインディングのインストール
- 3.5.2 プロンプトの構築とコンプリーションの取得
- 3.5.3 ChatGPTをまねたプログラム
- 3.5.4 [SYSTEM]に役割を指定
- 3.5.5 履歴の保持
- 3.6 Node.jsを使った呼び出し
- 3.7 Goを使った呼び出し
- 3.8 その他の機能
- 3.9 この章のまとめ
第4章 GPTによる次世代スタートアップの拡大
- 4.1 MaaS(Model-as-a-Service)
- 4.2 GPTベースの起業──ケーススタディ
- 4.2.1 Fable Studio クリエイター向けアプリケーション
- 4.2.2 Viable データ解析アプリケーション
- 4.2.3 Quickchat チャットボットアプリケーション
- 4.2.4 Copysmith マーケティングアプリケーション
- 4.2.5 Stenography コーディングアプリケーション
- 4.3 投資家から見たGPTのスタートアップ・エコシステム
- 4.4 この章のまとめ
第5章 GPTによる企業革新のネクストステップ
- 5.1 ケーススタディ──GitHub Copilot
- 5.1.1 Copilotの内部構造
- 5.1.2 GitHub Copilotの開発
- 5.1.3 ローコード/ノーコード・プログラミングとは?
- 5.1.4 APIとスケーリング
- 5.1.5 GitHub Copilotの次の展開は?
- 5.2 ケーススタディ──Algolia Answers
- 5.2.1 他モデルの評価
- 5.2.2 データのプライバシー
- 5.2.3 コスト
- 5.2.4 スピードと遅延
- 5.2.5 得られた学び
- 5.3 ケーススタディ──MicrosoftのAzure OpenAI Service
- 5.3.1 運命的なパートナーシップ
- 5.3.2 AzureネイティブのOpenAI API
- 5.3.3 リソース管理
- 5.3.4 セキュリティとデータプライバシー
- 5.3.5 企業にとってのMaaS
- 5.3.6 その他のMicrosoftのAIサービス
- 5.3.7 企業へのアドバイス
- 5.3.8 OpenAIかAzure OpenAI Serviceか
- 5.4 この章のまとめ
第6章 GPTのリスク
- 6.1 バイアスとの戦い
- 6.2 バイアス対策
- 6.3 低品質コンテンツと誤情報の拡散
- 6.4 LLMの環境への影響
- 6.5 注意しながら進める
- 6.6 この章のまとめ
第7章 AIへのアクセスの"民主化"
- 7.1 ノーコード? ノープロブレム!
- 7.2 AIへのアクセスとMaaS
- 7.3 最後に