[討論] 用基礎統計看 01金卡納測試
因為找不到測試本文
就用板友提供的圖片當作樣本資料
首先用R的KNN機器學習 填補遺失值
命名成RE
這次的試驗由於是實驗設計 適用ANOVA分析
*contrast利用helmert編成
*使用type3 SS
檢定結果
Pr(>F)
(Intercept) < 2.2e-16 ***
re$車手 2.034e-12 ***
re$廠牌 6.764e-06 ***
re$車手:re$廠牌 0.004231 ***
車手 跟 廠牌皆顯著對於實驗時間有影響(車再好也會被人劇烈影響)
車手跟廠牌之間也不獨立(廠牌情節?)
https://i.imgur.com/JPtKUAx.jpg
TukeyHSD 看有興趣的廠牌部分
upr p adj
2-1 -1.7530629 0.0000074
3-1 -0.9668515 0.0005248
4-1 -1.0598039 0.0003219
3-2 2.3459652 0.5367120
4-2 2.2530128 0.6357714
4-3 1.4668015 0.9985240
每家皆對於一號廠 有顯著差異
其餘三家差異不大
品牌
2 3 4 1
-------
--
--------------------------------------------------------
首先測試 該整體樣本是否符合常態分配
https://i.imgur.com/mMbOual.jpg
恩...顯著不符合
(因每配方測試重複兩次 故無法使用配方shapiro test)
那弄個BOX PLOT 看看
https://i.imgur.com/l9ctfLV.jpg
挖...這每組變異性非常大
不符合同值變異性的基本假設
看到這基本上可以判斷該次測試(實驗)是"失敗的"
基本上結果不具參考性
解決方法----> 增加實驗次數 減少測試人員數量 增加單人測試數量 輪胎控制等等
就是為了 降低誤差 讓資料符合檢定的基本條件
這種實驗是很多民調(抽樣) 試驗 沒有統計人員會出現的事情
那...如果遮住眼睛 做了檢定我們會得到甚麼結果?(所以上面看看就好)
-----------------------------------------------------------
KNN填補後資料
車手 廠牌 時間
1 1 49.43
1 1 43.77
1 2 37.95
1 2 37.42
1 3 38.82
1 3 39.63
1 4 41.42
1 4 38.73
2 1 45.47
2 1 48.96
2 2 47.85
2 2 41.68
2 3 47.12
2 3 45.79
2 4 51.55
2 4 49.07
3 1 46.29
3 1 45.72
3 2 45.99
3 2 45.27
3 3 53.76
3 3 45.68043068
3 4 41
3 4 43.02
4 1 45.8
4 1 45.06
4 2 44.30366532
4 2 44.17
4 3 44.05
4 3 42.68
4 4 43.53
4 4 42.3
5 1 50.9
5 1 51.64
5 2 45.57
5 2 46.71
5 3 44.10406845
5 3 46.89
5 4 47.8
5 4 47.92
6 1 42.62
6 1 41.28
6 2 39.53
6 2 39.69
6 3 40.05
6 3 40.03
6 4 39.83
6 4 41.2
7 1 42.25
7 1 41.83
7 2 41.2
7 2 39.05
7 3 42.3
7 3 40.92
7 4 41.15
7 4 39
8 1 44.88
8 1 42.67
8 2 43.43
8 2 39.1
8 3 38.33
8 3 37.09
8 4 37.86
8 4 37.02
9 1 45.79
9 1 43.3
9 2 39
9 2 39.26
9 3 41.5
9 3 42.18
9 4 40.10442261
9 4 40.10442261
10 1 41.99
10 1 41.52
10 2 39.17
10 2 38.57
10 3 39.52
10 3 40.19339335
10 4 46.25
10 4 39.92
--
Sent from my Windows
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.138.191
※ 文章網址: https://www.ptt.cc/bbs/car/M.1558463163.A.26E.html
推
05/22 02:46,
5年前
, 1F
05/22 02:46, 1F
推
05/22 02:51,
5年前
, 2F
05/22 02:51, 2F
推
05/22 02:59,
5年前
, 3F
05/22 02:59, 3F
推
05/22 03:07,
5年前
, 4F
05/22 03:07, 4F
→
05/22 03:10,
5年前
, 5F
05/22 03:10, 5F
推
05/22 03:16,
5年前
, 6F
05/22 03:16, 6F
→
05/22 03:16,
5年前
, 7F
05/22 03:16, 7F
→
05/22 03:16,
5年前
, 8F
05/22 03:16, 8F
→
05/22 03:16,
5年前
, 9F
05/22 03:16, 9F
噓
05/22 03:25,
5年前
, 10F
05/22 03:25, 10F
推
05/22 03:27,
5年前
, 11F
05/22 03:27, 11F
→
05/22 03:27,
5年前
, 12F
05/22 03:27, 12F
推
05/22 04:55,
5年前
, 13F
05/22 04:55, 13F
推
05/22 05:36,
5年前
, 14F
05/22 05:36, 14F
→
05/22 07:00,
5年前
, 15F
05/22 07:00, 15F
→
05/22 07:05,
5年前
, 16F
05/22 07:05, 16F
→
05/22 07:08,
5年前
, 17F
05/22 07:08, 17F
→
05/22 07:08,
5年前
, 18F
05/22 07:08, 18F
推
05/22 07:11,
5年前
, 19F
05/22 07:11, 19F
各組處理的變異性 不同
這應該是可以控制的
→
05/22 07:14,
5年前
, 20F
05/22 07:14, 20F
→
05/22 07:14,
5年前
, 21F
05/22 07:14, 21F
你統計真的該被當
噓
05/22 07:25,
5年前
, 22F
05/22 07:25, 22F
如果你要驗證某牌比較慢
這些都是基本要達到的條件
→
05/22 07:30,
5年前
, 23F
05/22 07:30, 23F
→
05/22 07:32,
5年前
, 24F
05/22 07:32, 24F
→
05/22 07:32,
5年前
, 25F
05/22 07:32, 25F
看不懂你想表達什麼
建議你重修
推
05/22 07:36,
5年前
, 26F
05/22 07:36, 26F
看不懂你想表達什麼
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 07:46:42
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 07:54:06
推
05/22 07:53,
5年前
, 27F
05/22 07:53, 27F
→
05/22 07:53,
5年前
, 28F
05/22 07:53, 28F
對
當然
只是這樣就無法真正比較是不是車款影響
→
05/22 07:54,
5年前
, 29F
05/22 07:54, 29F
來
你的世界冠軍跑步秒數的變異數
是不是跟別其他組 差距過大
整體跑步成績是否接近常態
因子個數幾個? 固定?隨機?
殘差分佈如何
試驗的前提
推
05/22 07:54,
5年前
, 30F
05/22 07:54, 30F
→
05/22 07:57,
5年前
, 31F
05/22 07:57, 31F
我也很討厭台灣保時捷ZZ
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 08:05:19
→
05/22 08:05,
5年前
, 32F
05/22 08:05, 32F
→
05/22 08:05,
5年前
, 33F
05/22 08:05, 33F
你的樣本資料?
你真的懂這p-vaule代表什麼嗎?
不要亂用 拜託去讀點書再來
※ 編輯: s90720eric (220.133.138.191), 05/22/2019 08:12:08
推
05/22 08:35,
5年前
, 34F
05/22 08:35, 34F
→
05/22 08:46,
5年前
, 35F
05/22 08:46, 35F
→
05/22 08:46,
5年前
, 36F
05/22 08:46, 36F
不是 是進行檢定的前提就不符合了
如果不是常態分配 是奇怪某分配
那麼進行檢定就沒有意義
這次
Normality assumption 是在於 conditional distribution of y given 車輛
這是必須的
當然可以單純看高低 只是很難下說 他跟其他組是有所不同的結論
※ 編輯: s90720eric (114.136.57.191), 05/22/2019 09:11:45
推
05/22 09:07,
5年前
, 37F
05/22 09:07, 37F
→
05/22 09:08,
5年前
, 38F
05/22 09:08, 38F
人為可以有變動
但應該要每個人的變動幅度差不多這樣
推
05/22 09:09,
5年前
, 39F
05/22 09:09, 39F
推
05/22 09:13,
5年前
, 40F
05/22 09:13, 40F
→
05/22 09:13,
5年前
, 41F
05/22 09:13, 41F
你沒拉到下面XD
我用Bartlett test
※ 編輯: s90720eric (114.136.57.191), 05/22/2019 09:16:21
推
05/22 09:15,
5年前
, 42F
05/22 09:15, 42F
→
05/22 09:16,
5年前
, 43F
05/22 09:16, 43F
→
05/22 09:35,
5年前
, 44F
05/22 09:35, 44F
→
05/22 09:36,
5年前
, 45F
05/22 09:36, 45F
→
05/22 09:36,
5年前
, 46F
05/22 09:36, 46F
→
05/22 09:43,
5年前
, 47F
05/22 09:43, 47F
→
05/22 09:44,
5年前
, 48F
05/22 09:44, 48F
→
05/22 09:58,
5年前
, 49F
05/22 09:58, 49F
推
05/22 10:13,
5年前
, 50F
05/22 10:13, 50F
→
05/22 10:13,
5年前
, 51F
05/22 10:13, 51F
推
05/22 10:15,
5年前
, 52F
05/22 10:15, 52F
推
05/22 10:16,
5年前
, 53F
05/22 10:16, 53F
推
05/22 10:20,
5年前
, 54F
05/22 10:20, 54F
推
05/22 10:29,
5年前
, 55F
05/22 10:29, 55F
噓
05/22 11:12,
5年前
, 56F
05/22 11:12, 56F
→
05/22 11:12,
5年前
, 57F
05/22 11:12, 57F
→
05/22 11:13,
5年前
, 58F
05/22 11:13, 58F
→
05/22 11:14,
5年前
, 59F
05/22 11:14, 59F
推
05/22 11:55,
5年前
, 60F
05/22 11:55, 60F
推
05/22 14:33,
5年前
, 61F
05/22 14:33, 61F
推
05/22 20:27,
5年前
, 62F
05/22 20:27, 62F
→
05/22 20:27,
5年前
, 63F
05/22 20:27, 63F