●第1章簡介
1.1自動語音識別:更好的溝通之橋
1.1.1人類之間的交流
1.1.2人機交流
1.2語音識別繫統的基本結構
1.3口語理解與人機對話繫統
1.4全書結構
第Ⅰ部分傳統聲學模型
第2章混合高斯模型
2.1隨機變量
2.2高斯分布和混合高斯隨機變量
2.3參數估計
2.4采用混合高斯分布對語音特征建模
第3章隱馬爾可夫模型及其變體
3.1介紹
3.2馬爾可夫鏈
3.3序列與模型
3.3.1隱馬爾可夫模型的性質
3.3.2隱馬爾可夫模型的仿真
3.3.3隱馬爾可夫模型似然度的計算
3.3.4計算似然度的高效算法
3.3.5前向與後向遞歸式的證明
3.4期望優選化算法及其在學習HMM參數中的應用
3.4.1期望優選化算法介紹
3.4.2使用EM算法來學習HMM參數——Baum-Welch算法
3.5用於解碼HMM狀態序列的維特比算法
3.5.1動態規劃和維特比算法
3.5.2用於解碼HMM狀態的動態規劃算法
3.6隱馬爾可夫模型和生成語音識別模型的變體
3.6.1用於語音識別的GMM-HMM模型
3.6.2基於軌跡和隱藏動態模型的語音建模和識別
3.6.3使用生成模型HMM及其變體解決語音識別問題
第Ⅱ部分深層神經網絡在語音識別中的應用及分析
第4章全連接深層神經網絡
4.1全連接深層神經網絡框架
4.2使用誤差反向傳播進行參數訓練
4.2.1訓練準則
4.2.2訓練算法
4.3實際應用
4.3.1數據預處理
4.3.2模型初始化
4.3.3權重衰減
4.3.4丟棄法
4.3.5批規範化
……
第Ⅲ部分優選深度學習模型在語音識別中的應用
第Ⅳ部分高級語音識別方法
第Ⅴ部分復雜場景下的語音識別
第Ⅵ部分口語理解及對話繫統的深度學習實踐
第Ⅶ部分總結及展望
縮略詞表
作者簡介
參考文獻
本書是全面且深入介紹語音識別及理解相關技術細節的專著。與我們在2014年出版的《解析深度學習:語音識別實踐》相比,本書在它的基礎上做了大量改寫,並對內容有大幅補充,詳細總結了近期新的語音識別算法及應用技術以及在口語對話繫統研究中基於深度學習的自然語言處理技術。全書首先概要介紹語音識別、口語理解和人機對話的基本概念與理論:接著全面深入地依次詳述傳統聲學模型、深層神經網絡在語音識別中的應用及分析、優選深度學習模型在語音識別中的應用、高級語音識別方法、復雜場景下的語音識別、以及口語理解及對話繫統的深度學習實踐。書中涉及的所有算法及技術細節都有詳盡的參考文獻,提供了深度學習在語音識別和口語對話理解中的應用全景。本書適合有一定機器學習或語音識別基礎的學生、研究者或從業者閱讀。