了得網圖書_現代語音信號處理

作者:無著胡航編

定價:65

出版社:電子工業出版社

出版日期:2014年07月01日

頁數:414

裝幀:平裝

ISBN:9787121226250

●第一篇語音信號處理基礎
第1章緒論1
1.1語音信號處理的發展歷史1
1.2語音信號處理的主要研究內容及發展
概況3
1.3本書的內容7
思考與復習題8
第2章語音信號處理的基礎知識9
2.1概述9
2.2語音產生的過程9
2.3語音信號的特性12
2.3.1語言和語音的基本特性12
2.3.2語音信號的時間波形和頻譜特性13
2.3.3語音信號的統計特性15
2.4語音產生的線性模型16
2.4.1激勵模型17
2.4.2聲道模型18
2.4.3輻射模型20
2.4.4語音信號數字模型21
2.5語音產生的非線性模型22
2.5.1FM-AM模型的基本原理22
2.5.2Teager能量算子22
2.5.3能量分離算法23
2.5.4FM-AM模型的應用24
2.6語音感知24
2.6.1聽覺繫統24
2.6.2神經繫統25
2.6.3語音感知26
思考與復習題29

第二篇語音信號分析
第3章時域分析30
3.1概述30
3.2數字化和預處理31
3.2.1取樣率和量化字長的選擇31
3.2.2預處理33
3.3短時能量分析34
3.4短時過零分析36
3.5短時相關分析39
3.5.1短時自相關函數39
3.5.2修正的短時自相關函數40
3.5.3短時平均幅差函數42
3.6語音端點檢測42
3.6.1雙門限前端檢測43
3.6.2多門限過零率前端檢測43
3.6.3基於FM-AM模型的端點檢測43
3.7基於高階累積量的語音端點檢測44
3.7.1噪聲環境下的端點檢測44
3.7.2高階累積量與高階譜44
3.7.3基於高階累積量的端點檢測46
思考與復習題48
第4章短時傅裡葉分析50
4.1概述50
4.2短時傅裡葉變換50
4.2.1短時傅裡葉變換的定義50
4.2.2傅裡葉變換的解釋51
4.2.3濾波器的解釋54
4.3短時傅裡葉變換的取樣率55
4.4語音信號的短時綜合56
4.4.1濾波器組求和法56
4.4.2FFT求和法58
4.5語譜圖59
思考與復習題61
第5章倒譜分析與同態濾波62
5.1概述62
5.2同態信號處理的基本原理62
5.3復倒譜和倒譜63
5.4語音信號兩個卷積分量復倒譜的性質64
5.4.1聲門激勵信號64
5.4.2聲道衝激響應序列65
5.5避免相位卷繞的算法66
5.5.1微分法67
5.5.2最小相位信號法67
5.5.3遞推法69
5.6語音信號復倒譜分析實例70
5.7Mel頻率倒譜繫數72
思考與復習題73
第6章線性預測分析74
6.1概述74
6.2線性預測分析的基本原理74
6.2.1基本原理74
6.2.2語音信號的線性預測分析75
6.3線性預測方程組的建立76
6.4線性預測分析的解法(1)―自相關和
協方差法77
6.4.1自相關法78
6.4.2協方差法79
6.4.3自相關和協方差法的比較80
6.5線性預測分析的解法(2)―格型法81
6.5.1格型法基本原理81
6.5.2格型法的求解83
6.6線性預測分析的應用―LPC譜估計和
LPC復倒譜85
6.6.1LPC譜估計85
6.6.2LPC復倒譜87
6.6.3LPC譜估計與其他譜分析方法的
比較88
6.7線譜對(LSP)分析89
6.7.1線譜對分析原理89
6.7.2線譜對參數的求解91
6.8極零模型91
思考與復習題93
第7章語音信號的非線性分析94
7.1概述94
7.2時頻分析94
7.2.1短時傅裡葉變換的局限95
7.2.2時頻分析96
7.3小波分析97
7.3.1概述97
7.3.2小波變換的定義97
7.3.3典型的小波函數99
7.3.4離散小波變換100
7.3.5小波多分辨分析與Mallat算法100
7.4基於小波的語音分析101
7.4.1語音分解與重構101
7.4.2清/濁音判斷102
7.4.3語音去噪102
7.4.4聽覺繫統模擬103
7.4.5小波包變換在語音端點檢測中的
應用103
7.5混沌與分形104
7.6基於混沌的語音分析105
7.6.1語音信號的混沌性105
7.6.2語音信號的相空間重構106
7.6.3語音信號的Lyapunov指數108
7.6.4基於混沌的語音、噪聲判別109
7.7基於分形的語音分析110
7.7.1概述110
7.7.2語音信號的分形特征111
7.7.3基於分形的語音分割112
思考與復習題113
第8章語音特征參數估計114
8.1基音估計114
8.1.1自相關法115
8.1.2並行處理法117
8.1.3倒譜法118
8.1.4簡化逆濾波法120
8.1.5高階累積量法122
8.1.6小波變換法123
8.1.7基音檢測的後處理124
8.2共振峰估計125
8.2.1帶通濾波器組法125
8.2.2DFT法126
8.2.3倒譜法127
8.2.4LPC法129
8.2.5FM-AM模型法130
思考與復習題131
第9章矢量量化132
9.1概述132
9.2矢量量化的基本原理133
9.3失真測度134
9.3.1歐氏距離―均方誤差135
9.3.2LPC失真測度135
9.3.3識別失真測度137
9.4很好矢量量化器和碼本的設計137
9.4.1矢量量化器很好設計的兩個條件137
9.4.2LBG算法138
9.4.3初始碼書生成138
9.5降低復雜度的矢量量化繫統139
9.5.1無記憶的矢量量化繫統140
9.5.2有記憶的矢量量化繫統142
9.6語音參數的矢量量化144
9.7模糊矢量量化145
9.7.1模糊集概述146
9.7.2模糊矢量量化147
9.8遺傳矢量量化148
9.8.1遺傳算法148
9.8.2遺傳矢量量化150
思考與復習題151
第10章隱馬爾可夫模型152
10.1概述152
10.2隱馬爾可夫模型的引入153
10.3隱馬爾可夫模型的定義155
10.4隱馬爾可夫模型三個問題的求解156
10.4.1概率的計算157
10.4.2HMM的識別159
10.4.3HMM的訓練160
10.4.4EM算法161
10.5HMM的選取162
10.5.1HMM的類型選擇162
10.5.2輸出概率分布的選取163
10.5.3狀態數的選取163
10.5.4初值選取163
10.5.5訓練準則的選取165
10.6HMM應用與實現中的一些問題166
10.6.1數據下溢166
10.6.2多輸出(觀察矢量序列)情況166
10.6.3訓練數據不足167
10.6.4考慮狀態持續時間的HMM168
10.7HMM的結構和類型170
10.7.1HMM的結構170
10.7.2HMM的類型172
10.7.3按輸出形式分類173
10.8HMM的相似度比較174
思考與復習題175

第三篇語音信號處理技術與應用
第11章語音編碼176
11.1概述176
11.2語音信號的壓縮編碼原理178
11.2.1語音壓縮的基本原理178
11.2.2語音通信中的語音質量179
11.2.3兩種壓縮編碼方式180
11.3語音信號的波形編碼180
11.3.1PCM及APCM180
11.3.2預測編碼及自適應預測編碼183
11.3.3ADPCM及ADM185
11.3.4子帶編碼(SBC)187
11.3.5自適應變換編碼(ATC)189
11.4聲碼器191
11.4.1概述191
11.4.2聲碼器的基本結構192
11.4.3通道聲碼器192
11.4.4同態聲碼器194
11.5LPC聲碼器195
11.5.1LPC參數的變換與量化196
11.5.2LPC-10197
11.5.3LPC-10e198
11.5.4變幀率LPC聲碼器199
11.6各種常規語音編碼方法的比較200
11.6.1波形編碼的信號壓縮技術200
11.6.2波形編碼與聲碼器的比較200
11.6.3各種聲碼器的比較201
11.7基於LPC模型的混合編碼201
11.7.1混合編碼采用的技術202
11.7.2MPLPC204
11.7.3RPELPC207
11.7.4CELP209
11.7.5CELP的改進形式211
11.7.6基於分形碼本的CELP213
11.8基於正弦模型的混合編碼214
11.8.1正弦變換編碼215
11.8.2多帶激勵(MBE)編碼215
11.9極低速率語音編碼217
11.9.1400～1.2kb/s數碼率的聲碼器217
11.9.2識別-合成型聲碼器218
11.10語音編碼的性能指標219
11.11語音編碼的質量評價221
11.11.1主觀評價方法221
11.11.2客觀評價方法222
11.11.3主客觀評價方法的結合225
11.11.4基於多重分形的語音質量評價226
11.12語音編碼國際標準227
11.13語音編碼與圖像編碼的關繫228
小結229
思考與復習題229
第12章語音合成231
12.1概述231
12.2語音合成原理232
12.2.1語音合成的方法232
12.2.2語音合成的繫統特性234
12.3共振峰合成235
12.3.1共振峰合成原理235
12.3.2共振峰合成實例237
12.4LPC合成237
12.5PSOLA語音合成239
12.5.1概述239
12.5.2PSOLA的原理240
12.5.3PSOLA的實現240
12.5.4PSOLA的改進242
12.5.5PSOLA語音合成繫統的發展243
12.6文語轉換繫統243
12.6.1組成與結構243
12.6.2文本分析244
12.6.3韻律控制245
12.6.4語音合成248
12.6.5TTS繫統的一些問題248
12.7基於HMM的參數化語音合成249
12.8語音合成的研究現狀和發展趨勢253
12.9語音合成硬件簡介255
思考與復習題256
第13章語音識別257
13.1概述257
13.2語音識別原理260
13.3動態時間規整264
13.4基於有限狀態矢量量化的語音識別266
13.5孤立詞識別繫統267
13.6連接詞識別270
13.6.1基本原理270
13.6.2基於DTW的連接詞識別271
13.6.3基於HMM的連接詞識別273
13.6.4基於分段K-均值的很好詞串分割及
模型訓練273
13.7連續語音識別274
13.7.1連續語音識別存在的困難274
13.7.2連續語音識別的訓練及識別方法275
13.7.3連續語音識別的整體模型276
13.7.4基於HMM統一框架的大詞彙非特定
人連續語音識別277
13.7.5聲學模型278
13.7.6語言學模型280
13.7.7很優路徑搜索282
13.8說話人自適應284
13.8.1MAP算法285
13.8.2基於變換的自適應方法285
13.8.3基於說話人分類的自適應方法286
13.9魯棒的語音識別287
13.10關鍵詞確認289
13.11可視語音識別291
13.11.1概述291
13.11.2機器自動唇讀291
13.11.3雙模態語音識別293
13.12語音理解296
13.12.1MAP語義解碼297
13.12.2語義結構的表示297
13.12.3意圖解碼器298
小結299
思考與復習題299
第14章說話人識別300
14.1概述300
14.2特征選取301
14.2.1說話人識別所用的特征301
14.2.2特征類型的優選準則302
14.2.3常用的特征參數303
14.3說話人識別繫統303
14.3.1說話人識別繫統的結構303
14.3.2說話人識別的基本方法概述304
14.4說話人識別繫統實例305
14.4.1DTW型說話人識別繫統305
14.4.2應用VQ的說話人識別繫統306
14.5基於HMM的說話人識別307
14.6基於GMM的說話人識別310
14.7說話人識別中需進一步研究的問題312
14.8語種辨識313
思考與復習題316
第15章智能信息處理技術在語音信號
處理中的應用317
15.1人工神經網絡317
15.1.1概述317
15.1.2神經網絡的基本概念319
15.2神經網絡的模型結構320
15.2.1單層感知機320
15.2.2多層感知機321
15.2.3自組織映射神經網絡323
15.2.4時延神經網絡324
15.2.5循環神經網絡325
15.3神經網絡與傳統方法的結合325
15.3.1概述325
15.3.2神經網絡與DTW326
15.3.3神經網絡與VQ326
15.3.4神經網絡與HMM327
15.4神經網絡語音識別328
15.4.1靜態語音識別328
15.4.2連續語音識別330
15.5基於神經網絡的說話人識別330
15.6基於神經網絡的語音信號非線性預測
編碼332
15.6.1語音信號的非線性預測332
15.6.2基於MLP的非線性預測編碼333
15.6.3基於RNN的非線性預測編碼334
15.7基於神經網絡的語音合成335
15.8支持向量機336
15.8.1概述336
15.8.2支持向量機的基本原理337
15.9基於支持向量機的語音分類識別339
15.10基於支持向量機的說話人識別340
15.10.1基於支持向量機的說話人辨認340
15.10.2基於支持向量機的說話人確認340
15.11基於混沌神經網絡的語音識別342
15.11.1混沌神經網絡342
15.11.2基於混沌神經網絡的語音識別342
15.12分形在語音識別中的應用344
15.13智能優化算法在語音信號處理中的
應用344
15.14各種智能信息處理技術的融合與
集成346
15.14.1模糊繫統與神經網絡的融合347
15.14.2神經網絡與遺傳算法的融合347
15.14.3模糊邏輯、神經網絡及遺傳算法的
融合348
15.14.4神經網絡、模糊邏輯及混沌的
融合349
15.14.5混沌與遺傳算法的融合349
思考與復習題350
第16章語音增強351
16.1概述351
16.2語音、人耳感知及噪聲的特性352
16.3濾波器法354
16.3.1固定濾波器354
16.3.2變換技術354
16.3.3自適應噪聲對消354
16.4非線性處理357
16.5基於相關特性的語音增強358
16.6減譜法359
16.6.1減譜法的基本原理359
16.6.2減譜法的改進形式360
16.7基於Wiener濾波的語音增強361
16.8基於語音產生模型的語音增強362
16.9基於小波的語音增強364
16.9.1概述364
16.9.2基於小波的語音增強364
16.9.3基於小波包的語音增強366
16.10基於信號子空間分解的語音增強367
16.11語音增強的一些新發展370
小結371
思考與復習題372
第17章基於麥克風陣列的語音信號
處理373
17.1概述373
17.2麥克風陣列語音處理技術的難點374
17.3聲源定位375
17.3.1去混響375
17.3.2近場模型376
17.3.3聲源定位377
17.4語音增強381
17.4.1概述381
17.4.2方法與技術382
17.4.3應用386
17.4.4本節小結387
17.5語音盲分離387
17.5.1瞬時線性混合模型388
17.5.2卷積混合模型393
17.5.3非線性混合模型395
17.5.4需進一步研究的問題396
思考與復習題396
漢英名詞術語對照398
參考文獻407

本書繫統介紹了語音信號處理的基礎、原理、方法、應用、新理論、新成果與新技術，以及該研究領域的背景知識、研究現狀、應用前景和發展趨勢。
全書分三篇共17章。第一篇語音信號處理基礎，包括第1章緒論，第2章語音信號處理的基礎知識；第二篇語音信號分析，包括第3章時域分析，第4章短時傅裡葉分析，第5章倒譜分析與同態濾波，第6章線性預測分析，第7章語音信號的非線性分析，第8章語音特征參數檢測與估計，第9章矢量量化，第10章隱馬爾可夫模型；第三篇語音信號處理技術與應用，包括第11章語音編碼，第12章語音合成，第13章語音識別，第14章說話人識別和語種辨識，第15章智能信息處理技術在語音信號處理中的應用，第16章語音增強，第17章基於麥克風陣列的語音信號處理。
本書體繫完整，結構嚴謹；繫統性強，層次分明；內容深入淺出，原理闡述透徹；取材廣泛，繁簡適中；內容豐富而新穎；聯繫實際應用。

商品搜索

商品分类

【醫學】

【各大出版社】