| | | 現代語音信號處理 | 該商品所屬分類:圖書 -> 工業 | 【市場價】 | 529-768元 | 【優惠價】 | 331-480元 | 【出版社】 | 電子工業出版社 | 【ISBN】 | 9787121226250 | 【折扣說明】 | 一次購物滿999元台幣免運費+贈品 一次購物滿2000元台幣95折+免運費+贈品 一次購物滿3000元台幣92折+免運費+贈品 一次購物滿4000元台幣88折+免運費+贈品
| 【本期贈品】 | ①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
| |
版本 | 正版全新電子版PDF檔 | 您已选择: | 正版全新 | 溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。 *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。 | | | | 內容介紹 | |
出版社:電子工業出版社 ISBN:9787121226250 商品編碼:1282919764 品牌:文軒 出版時間:2014-07-01 代碼:65 作者:無
" 作 者:無 著 胡航 編 定 價:65 出 版 社:電子工業出版社 出版日期:2014年07月01日 頁 數:414 裝 幀:平裝 ISBN:9787121226250 ●第一篇語音信號處理基礎 第1章緒論1 1.1語音信號處理的發展歷史1 1.2語音信號處理的主要研究內容及發展 概況3 1.3本書的內容7 思考與復習題8 第2章語音信號處理的基礎知識9 2.1概述9 2.2語音產生的過程9 2.3語音信號的特性12 2.3.1語言和語音的基本特性12 2.3.2語音信號的時間波形和頻譜特性13 2.3.3語音信號的統計特性15 2.4語音產生的線性模型16 2.4.1激勵模型17 2.4.2聲道模型18 2.4.3輻射模型20 2.4.4語音信號數字模型21 2.5語音產生的非線性模型22 2.5.1FM-AM模型的基本原理22 2.5.2Teager能量算子22 2.5.3能量分離算法23 2.5.4FM-AM模型的應用24 2.6語音感知24 2.6.1聽覺繫統24 2.6.2神經繫統25 2.6.3語音感知26 思考與復習題29
第二篇語音信號分析 第3章時域分析30 3.1概述30 3.2數字化和預處理31 3.2.1取樣率和量化字長的選擇31 3.2.2預處理33 3.3短時能量分析34 3.4短時過零分析36 3.5短時相關分析39 3.5.1短時自相關函數39 3.5.2修正的短時自相關函數40 3.5.3短時平均幅差函數42 3.6語音端點檢測42 3.6.1雙門限前端檢測43 3.6.2多門限過零率前端檢測43 3.6.3基於FM-AM模型的端點檢測43 3.7基於高階累積量的語音端點檢測44 3.7.1噪聲環境下的端點檢測44 3.7.2高階累積量與高階譜44 3.7.3基於高階累積量的端點檢測46 思考與復習題48 第4章短時傅裡葉分析50 4.1概述50 4.2短時傅裡葉變換50 4.2.1短時傅裡葉變換的定義50 4.2.2傅裡葉變換的解釋51 4.2.3濾波器的解釋54 4.3短時傅裡葉變換的取樣率55 4.4語音信號的短時綜合56 4.4.1濾波器組求和法56 4.4.2FFT求和法58 4.5語譜圖59 思考與復習題61 第5章倒譜分析與同態濾波62 5.1概述62 5.2同態信號處理的基本原理62 5.3復倒譜和倒譜63 5.4語音信號兩個卷積分量復倒譜的性質64 5.4.1聲門激勵信號64 5.4.2聲道衝激響應序列65 5.5避免相位卷繞的算法66 5.5.1微分法67 5.5.2最小相位信號法67 5.5.3遞推法69 5.6語音信號復倒譜分析實例70 5.7Mel頻率倒譜繫數72 思考與復習題73 第6章線性預測分析74 6.1概述74 6.2線性預測分析的基本原理74 6.2.1基本原理74 6.2.2語音信號的線性預測分析75 6.3線性預測方程組的建立76 6.4線性預測分析的解法(1)―自相關和 協方差法77 6.4.1自相關法78 6.4.2協方差法79 6.4.3自相關和協方差法的比較80 6.5線性預測分析的解法(2)―格型法81 6.5.1格型法基本原理81 6.5.2格型法的求解83 6.6線性預測分析的應用―LPC譜估計和 LPC復倒譜85 6.6.1LPC譜估計85 6.6.2LPC復倒譜87 6.6.3LPC譜估計與其他譜分析方法的 比較88 6.7線譜對(LSP)分析89 6.7.1線譜對分析原理89 6.7.2線譜對參數的求解91 6.8極零模型91 思考與復習題93 第7章語音信號的非線性分析94 7.1概述94 7.2時頻分析94 7.2.1短時傅裡葉變換的局限95 7.2.2時頻分析96 7.3小波分析97 7.3.1概述97 7.3.2小波變換的定義97 7.3.3典型的小波函數99 7.3.4離散小波變換100 7.3.5小波多分辨分析與Mallat算法100 7.4基於小波的語音分析101 7.4.1語音分解與重構101 7.4.2清/濁音判斷102 7.4.3語音去噪102 7.4.4聽覺繫統模擬103 7.4.5小波包變換在語音端點檢測中的 應用103 7.5混沌與分形104 7.6基於混沌的語音分析105 7.6.1語音信號的混沌性105 7.6.2語音信號的相空間重構106 7.6.3語音信號的Lyapunov指數108 7.6.4基於混沌的語音、噪聲判別109 7.7基於分形的語音分析110 7.7.1概述110 7.7.2語音信號的分形特征111 7.7.3基於分形的語音分割112 思考與復習題113 第8章語音特征參數估計114 8.1基音估計114 8.1.1自相關法115 8.1.2並行處理法117 8.1.3倒譜法118 8.1.4簡化逆濾波法120 8.1.5高階累積量法122 8.1.6小波變換法123 8.1.7基音檢測的後處理124 8.2共振峰估計125 8.2.1帶通濾波器組法125 8.2.2DFT法126 8.2.3倒譜法127 8.2.4LPC法129 8.2.5FM-AM模型法130 思考與復習題131 第9章矢量量化132 9.1概述132 9.2矢量量化的基本原理133 9.3失真測度134 9.3.1歐氏距離―均方誤差135 9.3.2LPC失真測度135 9.3.3識別失真測度137 9.4很好矢量量化器和碼本的設計137 9.4.1矢量量化器很好設計的兩個條件137 9.4.2LBG算法138 9.4.3初始碼書生成138 9.5降低復雜度的矢量量化繫統139 9.5.1無記憶的矢量量化繫統140 9.5.2有記憶的矢量量化繫統142 9.6語音參數的矢量量化144 9.7模糊矢量量化145 9.7.1模糊集概述146 9.7.2模糊矢量量化147 9.8遺傳矢量量化148 9.8.1遺傳算法148 9.8.2遺傳矢量量化150 思考與復習題151 第10章隱馬爾可夫模型152 10.1概述152 10.2隱馬爾可夫模型的引入153 10.3隱馬爾可夫模型的定義155 10.4隱馬爾可夫模型三個問題的求解156 10.4.1概率的計算157 10.4.2HMM的識別159 10.4.3HMM的訓練160 10.4.4EM算法161 10.5HMM的選取162 10.5.1HMM的類型選擇162 10.5.2輸出概率分布的選取163 10.5.3狀態數的選取163 10.5.4初值選取163 10.5.5訓練準則的選取165 10.6HMM應用與實現中的一些問題166 10.6.1數據下溢166 10.6.2多輸出(觀察矢量序列)情況166 10.6.3訓練數據不足167 10.6.4考慮狀態持續時間的HMM168 10.7HMM的結構和類型170 10.7.1HMM的結構170 10.7.2HMM的類型172 10.7.3按輸出形式分類173 10.8HMM的相似度比較174 思考與復習題175
第三篇語音信號處理技術與應用 第11章語音編碼176 11.1概述176 11.2語音信號的壓縮編碼原理178 11.2.1語音壓縮的基本原理178 11.2.2語音通信中的語音質量179 11.2.3兩種壓縮編碼方式180 11.3語音信號的波形編碼180 11.3.1PCM及APCM180 11.3.2預測編碼及自適應預測編碼183 11.3.3ADPCM及ADM185 11.3.4子帶編碼(SBC)187 11.3.5自適應變換編碼(ATC)189 11.4聲碼器191 11.4.1概述191 11.4.2聲碼器的基本結構192 11.4.3通道聲碼器192 11.4.4同態聲碼器194 11.5LPC聲碼器195 11.5.1LPC參數的變換與量化196 11.5.2LPC-10197 11.5.3LPC-10e198 11.5.4變幀率LPC聲碼器199 11.6各種常規語音編碼方法的比較200 11.6.1波形編碼的信號壓縮技術200 11.6.2波形編碼與聲碼器的比較200 11.6.3各種聲碼器的比較201 11.7基於LPC模型的混合編碼201 11.7.1混合編碼采用的技術202 11.7.2MPLPC204 11.7.3RPELPC207 11.7.4CELP209 11.7.5CELP的改進形式211 11.7.6基於分形碼本的CELP213 11.8基於正弦模型的混合編碼214 11.8.1正弦變換編碼215 11.8.2多帶激勵(MBE)編碼215 11.9極低速率語音編碼217 11.9.1400~1.2kb/s數碼率的聲碼器217 11.9.2識別-合成型聲碼器218 11.10語音編碼的性能指標219 11.11語音編碼的質量評價221 11.11.1主觀評價方法221 11.11.2客觀評價方法222 11.11.3主客觀評價方法的結合225 11.11.4基於多重分形的語音質量評價226 11.12語音編碼國際標準227 11.13語音編碼與圖像編碼的關繫228 小結229 思考與復習題229 第12章語音合成231 12.1概述231 12.2語音合成原理232 12.2.1語音合成的方法232 12.2.2語音合成的繫統特性234 12.3共振峰合成235 12.3.1共振峰合成原理235 12.3.2共振峰合成實例237 12.4LPC合成237 12.5PSOLA語音合成239 12.5.1概述239 12.5.2PSOLA的原理240 12.5.3PSOLA的實現240 12.5.4PSOLA的改進242 12.5.5PSOLA語音合成繫統的發展243 12.6文語轉換繫統243 12.6.1組成與結構243 12.6.2文本分析244 12.6.3韻律控制245 12.6.4語音合成248 12.6.5TTS繫統的一些問題248 12.7基於HMM的參數化語音合成249 12.8語音合成的研究現狀和發展趨勢253 12.9語音合成硬件簡介255 思考與復習題256 第13章語音識別257 13.1概述257 13.2語音識別原理260 13.3動態時間規整264 13.4基於有限狀態矢量量化的語音識別266 13.5孤立詞識別繫統267 13.6連接詞識別270 13.6.1基本原理270 13.6.2基於DTW的連接詞識別271 13.6.3基於HMM的連接詞識別273 13.6.4基於分段K-均值的很好詞串分割及 模型訓練273 13.7連續語音識別274 13.7.1連續語音識別存在的困難274 13.7.2連續語音識別的訓練及識別方法275 13.7.3連續語音識別的整體模型276 13.7.4基於HMM統一框架的大詞彙非特定 人連續語音識別277 13.7.5聲學模型278 13.7.6語言學模型280 13.7.7很優路徑搜索282 13.8說話人自適應284 13.8.1MAP算法285 13.8.2基於變換的自適應方法285 13.8.3基於說話人分類的自適應方法286 13.9魯棒的語音識別287 13.10關鍵詞確認289 13.11可視語音識別291 13.11.1概述291 13.11.2機器自動唇讀291 13.11.3雙模態語音識別293 13.12語音理解296 13.12.1MAP語義解碼297 13.12.2語義結構的表示297 13.12.3意圖解碼器298 小結299 思考與復習題299 第14章說話人識別300 14.1概述300 14.2特征選取301 14.2.1說話人識別所用的特征301 14.2.2特征類型的優選準則302 14.2.3常用的特征參數303 14.3說話人識別繫統303 14.3.1說話人識別繫統的結構303 14.3.2說話人識別的基本方法概述304 14.4說話人識別繫統實例305 14.4.1DTW型說話人識別繫統305 14.4.2應用VQ的說話人識別繫統306 14.5基於HMM的說話人識別307 14.6基於GMM的說話人識別310 14.7說話人識別中需進一步研究的問題312 14.8語種辨識313 思考與復習題316 第15章智能信息處理技術在語音信號 處理中的應用317 15.1人工神經網絡317 15.1.1概述317 15.1.2神經網絡的基本概念319 15.2神經網絡的模型結構320 15.2.1單層感知機320 15.2.2多層感知機321 15.2.3自組織映射神經網絡323 15.2.4時延神經網絡324 15.2.5循環神經網絡325 15.3神經網絡與傳統方法的結合325 15.3.1概述325 15.3.2神經網絡與DTW326 15.3.3神經網絡與VQ326 15.3.4神經網絡與HMM327 15.4神經網絡語音識別328 15.4.1靜態語音識別328 15.4.2連續語音識別330 15.5基於神經網絡的說話人識別330 15.6基於神經網絡的語音信號非線性預測 編碼332 15.6.1語音信號的非線性預測332 15.6.2基於MLP的非線性預測編碼333 15.6.3基於RNN的非線性預測編碼334 15.7基於神經網絡的語音合成335 15.8支持向量機336 15.8.1概述336 15.8.2支持向量機的基本原理337 15.9基於支持向量機的語音分類識別339 15.10基於支持向量機的說話人識別340 15.10.1基於支持向量機的說話人辨認340 15.10.2基於支持向量機的說話人確認340 15.11基於混沌神經網絡的語音識別342 15.11.1混沌神經網絡342 15.11.2基於混沌神經網絡的語音識別342 15.12分形在語音識別中的應用344 15.13智能優化算法在語音信號處理中的 應用344 15.14各種智能信息處理技術的融合與 集成346 15.14.1模糊繫統與神經網絡的融合347 15.14.2神經網絡與遺傳算法的融合347 15.14.3模糊邏輯、神經網絡及遺傳算法的 融合348 15.14.4神經網絡、模糊邏輯及混沌的 融合349 15.14.5混沌與遺傳算法的融合349 思考與復習題350 第16章語音增強351 16.1概述351 16.2語音、人耳感知及噪聲的特性352 16.3濾波器法354 16.3.1固定濾波器354 16.3.2變換技術354 16.3.3自適應噪聲對消354 16.4非線性處理357 16.5基於相關特性的語音增強358 16.6減譜法359 16.6.1減譜法的基本原理359 16.6.2減譜法的改進形式360 16.7基於Wiener濾波的語音增強361 16.8基於語音產生模型的語音增強362 16.9基於小波的語音增強364 16.9.1概述364 16.9.2基於小波的語音增強364 16.9.3基於小波包的語音增強366 16.10基於信號子空間分解的語音增強367 16.11語音增強的一些新發展370 小結371 思考與復習題372 第17章基於麥克風陣列的語音信號 處理373 17.1概述373 17.2麥克風陣列語音處理技術的難點374 17.3聲源定位375 17.3.1去混響375 17.3.2近場模型376 17.3.3聲源定位377 17.4語音增強381 17.4.1概述381 17.4.2方法與技術382 17.4.3應用386 17.4.4本節小結387 17.5語音盲分離387 17.5.1瞬時線性混合模型388 17.5.2卷積混合模型393 17.5.3非線性混合模型395 17.5.4需進一步研究的問題396 思考與復習題396 漢英名詞術語對照398 參考文獻407 本書繫統介紹了語音信號處理的基礎、原理、方法、應用、新理論、新成果與新技術,以及該研究領域的背景知識、研究現狀、應用前景和發展趨勢。 全書分三篇共17章。第一篇語音信號處理基礎,包括第1章緒論,第2章語音信號處理的基礎知識;第二篇語音信號分析,包括第3章時域分析,第4章短時傅裡葉分析,第5章倒譜分析與同態濾波,第6章線性預測分析,第7章語音信號的非線性分析,第8章語音特征參數檢測與估計,第9章矢量量化,第10章隱馬爾可夫模型;第三篇語音信號處理技術與應用,包括第11章語音編碼,第12章語音合成,第13章語音識別,第14章說話人識別和語種辨識,第15章智能信息處理技術在語音信號處理中的應用,第16章語音增強,第17章基於麥克風陣列的語音信號處理。 本書體繫完整,結構嚴謹;繫統性強,層次分明;內容深入淺出,原理闡述透徹;取材廣泛,繁簡適中;內容豐富而新穎;聯繫實際應用。
" | | | | | |