作者查詢 / f821027
作者 f821027 在 PTT [ DataScience ] 看板的留言(推文), 共21則
限定看板:DataScience
看板排序:
首頁
上一頁
1
下一頁
尾頁
15F推: X做標準化的部分同意4樓說的 有的模型對於outliers很敏11/11 20:28
16F→: 感 就適合先做標準化 你說的boxcox是針對y轉換 因為y資11/11 20:28
17F→: 料分佈標準差太大 把他做一個轉換後 再和X去build model11/11 20:28
18F→: 這個model predict出的Y再用boxcox反函數轉回原本y的樣11/11 20:28
19F→: 本空間11/11 20:28
8F推: 多個模型的話就是比較cross_val_score去比較平均的mse或02/16 12:19
9F→: mae等等哪個低02/16 12:19
10F→: 單模的話可以把每個folde的mse或mae都算出來 畫成折線圖02/16 12:19
11F→: 搭配std判斷資料的robustness02/16 12:19
12F→: 可以參考下面各種 cv 方法 https://scikit-learn.org/sta02/16 12:24
13F→: ble/modules/cross_validation.html02/16 12:24
14F推: 有點不太確定你說的testing set的意思,我的認知是all d02/17 15:00
15F→: ata 先分成training set 和 testing set,針對training02/17 15:00
16F→: set去做k-fold cross validation 去確保build出來的模型02/17 15:00
17F→: 參數會是最好的,當然fold越多的話 模型穩健度會越高,02/17 15:00
18F→: 那這k個fold都會有你放進cross_val_score裡面scoring參02/17 15:00
19F→: 數的指標,看你幾個fold,那這k個fold可以驗證你放的模02/17 15:00
20F→: 型的穩健性,可以透過std判斷02/17 15:00
3F→: 樓上的意思是先把兩個y做正規化,再加權平均成一個y做特12/11 19:07
4F→: 徵重要性排序嗎,不過我要怎麼知道兩個y權重要如何設定12/11 19:07
5F→: 呢12/11 19:07
首頁
上一頁
1
下一頁
尾頁