ギフトで購入

Pythonで学ぶ音源分離機械学習実践シリーズ

戸上真人

3,850円 (3,500円+税)

「音源分離」とはさまざまな音が混ざった中から欲しい音だけを抽出する技術です。音源分離の基礎からPythonを用いた実装までを詳しく解説しています。本書は中級者以上に向けた、特定の技術分野のアルゴリズムの紹介と、それを実装したコードを解説する、より技術的・実践的な「機械学習実践シリーズ」です。

【注意】本書のEPUB版は固定レイアウト型になっております。文字の大きさの変更や検索、引用などはお使いいただけません。画面の大きい端末でご利用ください。

内容紹介

中級者以上に向けた、特定の技術分野のアルゴリズムの紹介と、そのアルゴリズムを実装したコードを解説する、より技術的・実践的な「機械学習実践シリーズ」の1冊目として、「音源分離」をテーマとしています。近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の人の声を聞き取ることを想定しており、聞きたい人の声以外の音が入ってくると、どうしても聞きたい人の声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出するという技術です。本書では、音源分離の基礎から、Pythonを用いた実装までを詳しく解説しています。また、音源分離で用いる数学的知識の基礎として、線形代数や行列・ベクトルの微分の方法、確率統計の基礎について示しています。音源分離を理解しコードを書くためには、プログラミングに関する知識はもちろん、線形代数、微分積分、確率・統計といった数学的知識も必要不可欠です。とくに音源分離では複素数の行列・ベクトルを用いるので、複素数の計算方法について重点的に示しています。

書誌情報

著者: 戸上真人
発行日: 2020-08-24 (紙書籍版発行日: 2020-08-24)
最終更新日: 2021-06-21
バージョン: 1.2.0
ページ数: 352ページ(PDF版換算)
対応フォーマット: PDF, EPUB
出版社: インプレス

対象読者

音声処理のエンジニアや研究者、理系の大学生、Pythonで音源分離を実装したい人

著者について

戸上真人

2017年1月~2018年5月、スタンフォード大学のStanford Data Science Initiative (SDSI) Visiting Scholar。2018年6月にLINE株式会社入社。現在、同社のAI研究組織であるData LabsのSpeech TeamのManager兼Principal Researcher。(一社)人工知能学会理事。16年以上に渡り、音声処理の研究開発に従事。東京大学工学系研究科より2011年に博士(工学)授与。登録特許20件以上、査読あり論文9件、査読あり国際会議での採択論文数60件以上。IEEE Senior Member。

第1節本章の概要　
第2節凸関数最小化　
第3節ラグランジュ未定乗数法による制約付き最適化問題
第4節確率・統計的なフレームワークに基づくパラメータ最適化
第5節 MM（Maximization-Majorization）法に基づくパラメータ最適化
コラム：音源分離で好まれるパラメータ最適化法の特徴

第5章シミュレータで音を作ってみる

第1節シミュレータを用いた音の生成法　
コラム：シミュレータと実収録データによる実験の併用について

第6章古典的な音源分離方法～ビームフォーミング～

第1節本書で紹介する音源分離法の分類と本章で紹介するビームフォーミング法の概要
第2節入力信号のモデル化
第3節ステアリングベクトルの計算方法　
第4節遅延和アレイDSBF
第5節最小分散無歪ビームフォーマ（MVDR）
第6節最大SNRビームフォーマ（MaxSNR）
第7節マルチチャンネルウィナーフィルタ（MWF）
コラム：単純だが奥が深いビームフォーミング法

第7章音源方向推定に基づく音源分離

第1節本章の概要
第2節音声のスパース性に基づく音源分離
第3節音声のスパース性とビームフォーミングの統合
コラム：ビームフォーミング法の実用化

第8章現代的な統計的モデルに基づく音源分離法

第1節本章の概要
第2節独立成分分析
第3節独立ベクトル分析　
第4節独立低ランク分析　
第5節マルチチャンネル時変ガウスモデル　
コラム：業界を賑わせたブラインド音源分離法

第9章響きのある音を響きのない音に変える残響除去法

第1節残響除去問題の定義
第2節空間的な逆フィルタ
第3節線形予測に基づく残響除去　
第4節時変ガウスモデルを用いた残響除去　
コラム：地味だが実用性の高い残響除去技術

第10章音源分離と残響除去を統合的に実行する

第1節本章の概要
第2節マルチチャンネルの時変ガウスモデルに基づく音源分離と残響除去の同時実行
第3節独立低ランク分析に基づく音源分離と残響除去の同時実行
第11章音源分離関連のライブラリ紹介・その他のトピック・参考文献
第1節音源分離関連Pythonライブラリ
第2節その他のトピック
第3節参考文献

おわりに

索引

Home 〉書籍一覧〉 Pythonで学ぶ音源分離機械学習実践シリーズ ▲ ページトップへ戻る

Pythonで学ぶ音源分離機械学習実践シリーズ

関連サイト

内容紹介

書誌情報

対象読者

著者について

戸上真人

目次

本書の前提

目次

序章

第1章音源分離とは？

第2章音声処理の基礎

第3章音源分離で用いる数学的知識の基礎（線形代数、ベクトル・行列の微分）

第4章「最適化」に関する技法を理解する

第5章シミュレータで音を作ってみる

第6章古典的な音源分離方法～ビームフォーミング～

第7章音源方向推定に基づく音源分離

第8章現代的な統計的モデルに基づく音源分離法

第9章響きのある音を響きのない音に変える残響除去法

第10章音源分離と残響除去を統合的に実行する

おわりに

索引

Pythonで学ぶ音源分離 機械学習実践シリーズ

関連サイト

内容紹介

書誌情報

対象読者

著者について

戸上真人

目次

本書の前提

目次

序章

第1章 音源分離とは？

第2章 音声処理の基礎

第3章 音源分離で用いる数学的知識の基礎（線形代数、ベクトル・行列の微分）

第4章 「最適化」に関する技法を理解する

第5章 シミュレータで音を作ってみる

第6章 古典的な音源分離方法～ビームフォーミング～

第7章 音源方向推定に基づく音源分離

第8章 現代的な統計的モデルに基づく音源分離法

第9章 響きのある音を響きのない音に変える残響除去法

第10章 音源分離と残響除去を統合的に実行する

おわりに

索引

Pythonで学ぶ音源分離機械学習実践シリーズ

第1章音源分離とは？

第2章音声処理の基礎

第3章音源分離で用いる数学的知識の基礎（線形代数、ベクトル・行列の微分）

第4章「最適化」に関する技法を理解する

第5章シミュレータで音を作ってみる

第6章古典的な音源分離方法～ビームフォーミング～

第7章音源方向推定に基づく音源分離

第8章現代的な統計的モデルに基づく音源分離法

第9章響きのある音を響きのない音に変える残響除去法

第10章音源分離と残響除去を統合的に実行する