Re: [語音] 你好我是旁聽語音處理的學生有些問쌠…

看板NTUEE_Speech作者kobetodd (供水電)時間16年前 (2010/01/19 12:53)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串2/2 (看更多)

※ 引述《Lgsun (progress)》之銘言： : ※ 引述《kobetodd (供水電)》之銘言： : : 本人在處理相關語音的研究， : : 知道語音相關理論一開始要做預處理， : : 如預強調、去靜音，再做特徵提取 : : 首先我的問題是 : : 1.預強調目的在提升高頻的振幅大小， : : 使高頻帶的聲音能聽較明顯，訊噪比提高。 : : 至於特徵提取是看瞬時頻率(頻率隨時間變化) : : 兩者的目的不一樣，故看瞬時頻率可以不用做預處理吧？ : 做語音MFCC抽取時，必須做pre-emphasis，加強高頻的部分 : 由於高頻帶能量通常很小，但卻常保留重要的phoneme鑑別資訊 : 故須先做pre-emphasis，使其能量和低頻能量接近 : 之後做處理時，才不致於被低頻的能量所dominate : 至於feature並不能說是描述瞬時頻率，這種說法有點奇怪 : MFCC是由通過數組(通常23組)Mel-filter bank得到的值再取DCT而得到， : DCT主要功用是de-correlation和降維 : 所以MFCC描述的應該是"語音信號通過23個頻帶的能量值"再降成13維而得到 : MFCC並非描述瞬時頻率，他描述的仍然是能量 : : 2.現在有了特徵提取的瞬時頻率，如何利用向量量化得到編碼本？ : : 向量量化的理論我是有看了相關資料，有問過同學是用htk : : 不過是對於MFCC，如果是對其他特徵提取方法也能用htk嗎 : : htk對於c語言，如果是使用matlab要如何處理這種問題？ : 用 k-means 的演算法來做即可，HTK也可以處理PLP之類的參數 : 如果要用matlab，你應該先決定要變成幾維的codebook : 然後再寫個k-means，就可以搞定了吧.... 語音lab的同學你們好，有些問題想問一下，前陣子你們說htk可以處理PLP參數，是指在c語言嗎還是matlab，PLP參數不是很懂。至於我的瞬頻想說能否像 MFCC 丟到htk 去跑VQ，還是有其他方法，想說這樣去做會比較快，謝謝你們的協助 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 219.68.80.34

‣ 返回看板[ NTUEE_Speech ] 電信

‣ 更多 kobetodd 的文章

文章代碼(AID): #1BLJhbym (NTUEE_Speech)