[問題] CNN語音辨識問題已刪文
我現在有197個分類的資料夾,每個資料夾內有745個同樣內容,但不同速率、音頻與大小
,然後將語音資料轉成特徵向量(不是用librosa套件)並堆疊成一個array後,經過
train_test_split切割為:X_train.shape=(187,745)
X_test.shape=(10,745)
y_train.shape=(187,745)
y_test.shape=(10,745)
現在要將X_train與X_test reshape成四維度的資料,如
X_train=X_test.reshape(X_train.shape[0], ? , ? , 1) 讓cnn的第一層
input_shape=(? , ? , 1),其中,要怎麼決定中間兩個問號的值?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.69.63.115 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1566371904.A.F6E.html
推
08/21 15:34,
4年前
, 1F
08/21 15:34, 1F
推
08/21 16:51,
4年前
, 2F
08/21 16:51, 2F
→
08/21 18:37,
4年前
, 3F
08/21 18:37, 3F
→
08/21 20:08,
4年前
, 4F
08/21 20:08, 4F
→
08/21 20:21,
4年前
, 5F
08/21 20:21, 5F
→
08/21 20:21,
4年前
, 6F
08/21 20:21, 6F
→
08/21 20:22,
4年前
, 7F
08/21 20:22, 7F
→
08/21 20:24,
4年前
, 8F
08/21 20:24, 8F
→
08/21 20:24,
4年前
, 9F
08/21 20:24, 9F
推
08/21 21:23,
4年前
, 10F
08/21 21:23, 10F
推
08/22 08:09,
4年前
, 11F
08/22 08:09, 11F