[問題] pydub 切割音訊

看板Python作者 (yshihyu)時間4年前 (2019/10/07 20:13), 4年前編輯推噓5(505)
留言10則, 2人參與, 4年前最新討論串1/1
我有一本英文單字書 mp3檔案, 每個檔案是一個章節全部單字+例子 每個章節的mp3檔案是 該單元的 單字唸完後 會再念一個例句, 在念下個單字&例句 後面依此類推 我想製作成anki 去複習單字, 我使用下面網址程式碼切割出來大致都沒問題 https://gist.github.com/shihyu/8199c1839c565169f7552e419d29b829 但單字發音之前會先念單字數英文發音, 我不想要念單字發音之前先念個英文數字 想不到有什麼方法可以切掉英文數字發音, 有使用過pydub 有什麼建議嘛? 下面兩個網址我想切割的單字檔案 http://www.mediafire.com/file/51427vdcsfkcjsh/0002.mp3/file https://www.mediafire.com/file/ln5knyhs1kzgr66/0077.mp3/file 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.157.77 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1570450421.A.DB6.html

10/07 23:19, 4年前 , 1F
這個問題的答案應該會依照「英文數字」的資料樣貌來決定
10/07 23:19, 1F

10/07 23:20, 4年前 , 2F
不同的「英文數字」會有不同的作法,放幾個樣本給大家看?
10/07 23:20, 2F

10/07 23:21, 4年前 , 3F
如果連資料長什麼樣子都沒不知道的話,很難推薦有效作法
10/07 23:21, 3F
※ 編輯: yshihyu (175.182.195.53 臺灣), 10/08/2019 20:40:25

10/09 19:29, 4年前 , 4F
開頭的英文數字跟後面的單字發音中間會有很明顯的停頓
10/09 19:29, 4F

10/09 19:31, 4年前 , 5F
最簡單的做法可以用振幅的波谷來分割切開就行了
10/09 19:31, 5F

10/09 19:38, 4年前 , 6F
更進階一點的作法可以用speech segmentation的套件像是
10/09 19:38, 6F

10/09 19:38, 4年前 , 7F

10/09 19:42, 4年前 , 8F
這種資料內容還滿規律的,理論上應該很容易做到才是
10/09 19:42, 8F

10/11 21:27, 4年前 , 9F
我使用 inaSpeechSegmenter 可以分析出來,
10/11 21:27, 9F

10/12 23:56, 4年前 , 10F
唉唷,不錯喔~
10/12 23:56, 10F
文章代碼(AID): #1Tcolrss (Python)