[問題] 變異數檢定還是t-test?
有一組心臟病的資料,樣本數大概有三百個、共有13個變數,有類別也有連續變數、目標
變數是二元離散變數(0、1)
要對資料進行建模分類,但在分類之前想要先做檢定刪掉對目標變數沒有影響力的變數,
就是某個變數x在目標變數的兩個類別中是沒有顯著差異的就刪掉,不知道這樣的想法有
沒有問題?
如果可以的話是做t檢定還是變異數檢定?如果是t檢定的話又分為獨立、單一跟成對,要
用哪個呢?針對離散變數的話是做卡方檢定嗎?如果做變異數檢定的話是不是一定要先做
常態、線性跟同質性檢定?
不好意思因為想要做一套完整的分析所以問題有點多
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.19.228.155 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1587695818.A.91E.html
推
04/24 11:11,
4年前
, 1F
04/24 11:11, 1F
→
04/24 11:11,
4年前
, 2F
04/24 11:11, 2F
因為這次並沒有打算使用邏輯斯迴歸而是選擇其他方法,所以想說可不可以用檢定的方式
選擇變數
※ 編輯: wangborwai (117.19.228.155 臺灣), 04/24/2020 13:21:12
→
04/24 13:46,
4年前
, 3F
04/24 13:46, 3F
→
04/24 13:48,
4年前
, 4F
04/24 13:48, 4F
→
04/24 13:51,
4年前
, 5F
04/24 13:51, 5F
→
04/24 13:53,
4年前
, 6F
04/24 13:53, 6F
→
04/24 13:54,
4年前
, 7F
04/24 13:54, 7F
推
04/24 20:03,
4年前
, 8F
04/24 20:03, 8F
推
04/28 12:55,
4年前
, 9F
04/28 12:55, 9F
→
04/28 12:55,
4年前
, 10F
04/28 12:55, 10F
推
04/28 12:58,
4年前
, 11F
04/28 12:58, 11F
→
04/28 12:58,
4年前
, 12F
04/28 12:58, 12F
推
05/02 15:18,
4年前
, 13F
05/02 15:18, 13F