Python・Colab・NLP入門 PythonとGoogle Colaboratoryではじめる自然言語処理
1,980円
990円
(900円+税)
《特価》
【注意】本書のEPUB版は固定レイアウト型になっております。文字の大きさの変更や検索、引用などはお使いいただけません。画面の大きい端末でご利用ください。
関連サイト
本書の関連ページが用意されています。
内容紹介
本書は自然言語処理のPythonプログラミングに必要な要点を簡潔かつわかりやすく解説しています。環境構築の手間がかからないGoogle Colaboratoryで手軽にプログラミングを試し、自然言語処理の習得へステップアップしていける入門書にふさわしい一冊です。
書誌情報
- 著者: 井田 昌之
- 発行日: 2021-10-29
- 最終更新日: 2021-10-29
- バージョン: 1.0.0
- ページ数: 148ページ(PDF版換算)
- 対応フォーマット: PDF, EPUB
- 出版社: 近代科学社Digital
対象読者
自然言語処理,Natural Language Processing,Python,Google Colaboratory,NumPy,Pandas,Gensim,コーパス,NLTK,GiNZA,形態素解析,構文解析,word2vec,意味解析,文脈解析,テキストマイニング,機械翻訳に興味がある人
著者について
井田 昌之
青山学院大学名誉教授、工学博士。
1981年、青山学院大学大学院理工学研究科経営工学専攻博士課程修了、同年同大学理工学部助手、専任講師、助教授を経て、1988年同大学付属情報科学研究センタ研究教育開発室助教授としてキャンパスネットワーク構築。1995年同大学国際政治経済学部へ移籍。97年同学部教授、2001年同大学大学院国際マネジメント研究科教授としてITおよびネットビジネス・EC基盤を担当。2010年学校法人青山学院理事・副院長、2020年3月定年退職、その後、非常勤講師としてIT、Global IT、応用AI、EC関連科目を複数大学で担当、また、教育機関でのIR指導にあたる。この間、1988年より6年間米国ANSI X3J13正員としてCommon Lisp規格制定に従事、1993年および2002年マサチューセッツ工科大学人工知能研究所客員教授、1999年Java言語仕様レビューア、フリーソフトウェア財団副理事長などを経験。商用言語処理系開発リーダ複数経験。2005年よりIAMSCU国際教育機関連盟理事を経験。この頃より、米国IT企業交流・起業支援ならびに新事業支援経験、ベトナムでのIT設計指導・大学教育経験多数、特に、2010年よりホーチミン自然科学大学、ハノイ工科大学にて正規科目を担当。JICA短期専門家として複数国でのIT最新技術導入を指導。
主要著書『UNIX詳説』、丸善、1984(のちにLinux詳説として改訂、2004)、『Common Lisp』、共訳、編著、共立出版、初版1985、改訂版1991、『Common Lisp オブジェクトシステム』、共著、共立出版、1989、『キャンパスネットワーキング』、分担執筆、共立出版、1990、『AI白書』、分担執筆、コンピュータエージ社、1991、『Xウィンドウとその仲間たち』、分担執筆、共立出版、1992、『Lisp原書第3版』、共訳、培風館、1992、『はやわかりJava』、共立出版、1996、『HTML詳説』、共立出版、1999、『情報の表現』、岩波講座マルチメディア情報学分担執筆、岩波書店、2000、『オープンソースがなぜビジネスになるか』、共著、毎日コミュニケーションズ、2006、『Elements of Net Business Ethics』、Cogeime(英語)、 2009
目次
第1章 ことはじめ
- 1.1 Python豆知識
- 1.2 Google Colaboratoryを開いてみる
- 1.3 インポートする:さまざまな機能はモジュールとして用意されている
- 1.4 ノートブックということ
- 1.5 インタプリタによるプログラムの実行
第2章 文法:基礎編
- 2.1 四則演算、変数、代入文、式、関数呼び出し、コメント
- 2.2 モジュール、import、モジュールにある関数の呼び出し
- 2.3 文字列
- 2.4 基本的な入出力
- 2.5 リストと配列、array、ndarray
- 2.6 条件式と判断分岐
- 2.7 for文による回数指定の繰り返し
- 2.8 while文による条件を満たす間の繰り返し
- 2.9 繰り返しを制御するbreak、continue、elseと多重ループ
- 2.10 関数を定義する
- 2.11 辞書型
- 2.12 リスト内包表記
- 2.13 Eval/Exec:切れ味鋭い万能関数
第3章 Google Colabに親しむ
- 3.1 Colabノートブックの利用
- 3.2 Colabでのコマンディング
第4章 モジュールに親しむ
- 4.1 NumPy
- 4.2 Pandas
- 4.3 グラフ表示にmatplotlibのpyplotを使う
- 4.4 Gensim
- 4.5 データセットの入手とNLTK
- 4.6 Scikit-learn
第5章 データファイルの読み書き
- 5.1 文字コードと日本語テキストデータの扱い
- 5.2 ファイルの読み込み
- 5.3 ファイルの書き込み
第6章 自然言語処理(NLP)する
- 6.1 NLPに便利なPythonの構文
- 6.2 spaCyでテキスト解析
- 6.3 GiNZAで、日本語テキストの形態素解析
- 6.4 spaCyでコサイン類似度を調べる
- 6.5 GiNZAで「幸福の王子」テキストの分かち書き化
第7章 WordCloudで直観を可視化
- 7.1 WordCloudの準備
- 7.2 WordCloudを実行し、画像を生成する
- 7.3 WordCloudに任意形を与える
第8章 トピックモデリング
- 8.1 LDAに取り組む
- 8.2 日本語テキストに対するLDAモデリング
- 8.3 ロイターデータセットの入門的トピックモデリング
- 8.4 Word2vecでトピック分析
- 8.5 この先の課題から