[討論] 用基礎統計看 01金卡納測試

看板car作者 (SkySI)時間5年前 (2019/05/22 02:26), 5年前編輯推噓22(25335)
留言63則, 35人參與, 5年前最新討論串1/1
因為找不到測試本文 就用板友提供的圖片當作樣本資料 首先用R的KNN機器學習 填補遺失值 命名成RE 這次的試驗由於是實驗設計 適用ANOVA分析 *contrast利用helmert編成 *使用type3 SS 檢定結果 Pr(>F) (Intercept) < 2.2e-16 *** re$車手 2.034e-12 *** re$廠牌 6.764e-06 *** re$車手:re$廠牌 0.004231 *** 車手 跟 廠牌皆顯著對於實驗時間有影響(車再好也會被人劇烈影響) 車手跟廠牌之間也不獨立(廠牌情節?) https://i.imgur.com/JPtKUAx.jpg
TukeyHSD 看有興趣的廠牌部分 upr p adj 2-1 -1.7530629 0.0000074 3-1 -0.9668515 0.0005248 4-1 -1.0598039 0.0003219 3-2 2.3459652 0.5367120 4-2 2.2530128 0.6357714 4-3 1.4668015 0.9985240 每家皆對於一號廠 有顯著差異 其餘三家差異不大 品牌 2 3 4 1 ------- -- -------------------------------------------------------- 首先測試 該整體樣本是否符合常態分配 https://i.imgur.com/mMbOual.jpg
恩...顯著不符合 (因每配方測試重複兩次 故無法使用配方shapiro test) 那弄個BOX PLOT 看看 https://i.imgur.com/l9ctfLV.jpg
https://i.imgur.com/RxfESY9.jpg
挖...這每組變異性非常大 不符合同值變異性的基本假設 看到這基本上可以判斷該次測試(實驗)是"失敗的" 基本上結果不具參考性 解決方法----> 增加實驗次數 減少測試人員數量 增加單人測試數量 輪胎控制等等 就是為了 降低誤差 讓資料符合檢定的基本條件 這種實驗是很多民調(抽樣) 試驗 沒有統計人員會出現的事情 那...如果遮住眼睛 做了檢定我們會得到甚麼結果?(所以上面看看就好) ----------------------------------------------------------- KNN填補後資料 車手 廠牌 時間 1 1 49.43 1 1 43.77 1 2 37.95 1 2 37.42 1 3 38.82 1 3 39.63 1 4 41.42 1 4 38.73 2 1 45.47 2 1 48.96 2 2 47.85 2 2 41.68 2 3 47.12 2 3 45.79 2 4 51.55 2 4 49.07 3 1 46.29 3 1 45.72 3 2 45.99 3 2 45.27 3 3 53.76 3 3 45.68043068 3 4 41 3 4 43.02 4 1 45.8 4 1 45.06 4 2 44.30366532 4 2 44.17 4 3 44.05 4 3 42.68 4 4 43.53 4 4 42.3 5 1 50.9 5 1 51.64 5 2 45.57 5 2 46.71 5 3 44.10406845 5 3 46.89 5 4 47.8 5 4 47.92 6 1 42.62 6 1 41.28 6 2 39.53 6 2 39.69 6 3 40.05 6 3 40.03 6 4 39.83 6 4 41.2 7 1 42.25 7 1 41.83 7 2 41.2 7 2 39.05 7 3 42.3 7 3 40.92 7 4 41.15 7 4 39 8 1 44.88 8 1 42.67 8 2 43.43 8 2 39.1 8 3 38.33 8 3 37.09 8 4 37.86 8 4 37.02 9 1 45.79 9 1 43.3 9 2 39 9 2 39.26 9 3 41.5 9 3 42.18 9 4 40.10442261 9 4 40.10442261 10 1 41.99 10 1 41.52 10 2 39.17 10 2 38.57 10 3 39.52 10 3 40.19339335 10 4 46.25 10 4 39.92 -- Sent from my Windows -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.138.191 ※ 文章網址: https://www.ptt.cc/bbs/car/M.1558463163.A.26E.html

05/22 02:46, 5年前 , 1F
快推 不然人家以為我看不懂
05/22 02:46, 1F

05/22 02:51, 5年前 , 2F
原來是這樣啊 跟我想的一樣
05/22 02:51, 2F

05/22 02:59, 5年前 , 3F
果然沒錯
05/22 02:59, 3F

05/22 03:07, 5年前 , 4F
這幹嘛 寫論文喔
05/22 03:07, 4F

05/22 03:10, 5年前 , 5F
這就幾個網友下去跑出來的數值,差異性太大了啦
05/22 03:10, 5F

05/22 03:16, 5年前 , 6F
車輛是交由人類駕駛 相對會有快慢 也有很快很慢的數據 這
05/22 03:16, 6F

05/22 03:16, 5年前 , 7F
種人的因素無可避免 應設定上下界限把極端值先去掉 再來看
05/22 03:16, 7F

05/22 03:16, 5年前 , 8F
數據合理性統計結果 你不把極端值去掉 最好能算出漂亮的統
05/22 03:16, 8F

05/22 03:16, 5年前 , 9F
計數據 你的統計學 學的真棒
05/22 03:16, 9F

05/22 03:25, 5年前 , 10F
還在崩潰
05/22 03:25, 10F

05/22 03:27, 5年前 , 11F
感覺還在崩潰 算變異數把極端值也列入 當然變異數會大 你
05/22 03:27, 11F

05/22 03:27, 5年前 , 12F
統計學學成這樣 還好意思來說嘴這次金卡納測試方法不對
05/22 03:27, 12F

05/22 04:55, 5年前 , 13F
恩 跟我想的差不多
05/22 04:55, 13F

05/22 05:36, 5年前 , 14F
統計學都還給老師了
05/22 05:36, 14F

05/22 07:00, 5年前 , 15F
蠻無聊的
05/22 07:00, 15F

05/22 07:05, 5年前 , 16F

05/22 07:08, 5年前 , 17F
趣味性質比較高XDDD
05/22 07:08, 17F

05/22 07:08, 5年前 , 18F
不知道為什麼寫一堆數據但覺得沒有很厲害?
05/22 07:08, 18F

05/22 07:11, 5年前 , 19F
樣本數過少,無解
05/22 07:11, 19F
各組處理的變異性 不同 這應該是可以控制的

05/22 07:14, 5年前 , 20F
我統計被老師當掉時,我也曾經去找他抗議:「你怎麼可
05/22 07:14, 20F

05/22 07:14, 5年前 , 21F
以只靠單一次取樣就判斷我不符合及格標準?」
05/22 07:14, 21F
你統計真的該被當

05/22 07:25, 5年前 , 22F
依你這樣分析的話所有的賽道成績都是個屁
05/22 07:25, 22F
如果你要驗證某牌比較慢 這些都是基本要達到的條件

05/22 07:30, 5年前 , 23F
變異值大 叫做失敗的話 統計學看來你也要重修了
05/22 07:30, 23F

05/22 07:32, 5年前 , 24F
你可以叫一個百米世界紀錄的人 跑個20-50次 然後告訴他
05/22 07:32, 24F

05/22 07:32, 5年前 , 25F
你的世界紀錄 「沒有鑑別度」 ~
05/22 07:32, 25F
看不懂你想表達什麼 建議你重修

05/22 07:36, 5年前 , 26F
以後也不用比賽賽車 直接數據打一打就好
05/22 07:36, 26F
看不懂你想表達什麼 ※ 編輯: s90720eric (220.133.138.191), 05/22/2019 07:46:42 ※ 編輯: s90720eric (220.133.138.191), 05/22/2019 07:54:06

05/22 07:53, 5年前 , 27F
實驗設計還是要討論一下成本跟時間啦 況且01的測試
05/22 07:53, 27F

05/22 07:53, 5年前 , 28F
根本沒從實驗設計的角度去設計啊-.-
05/22 07:53, 28F
對 當然 只是這樣就無法真正比較是不是車款影響

05/22 07:54, 5年前 , 29F
我也不懂你想表達什麼
05/22 07:54, 29F
來 你的世界冠軍跑步秒數的變異數 是不是跟別其他組 差距過大 整體跑步成績是否接近常態 因子個數幾個? 固定?隨機? 殘差分佈如何 試驗的前提

05/22 07:54, 5年前 , 30F
風向不對 如果今天神A跑最慢 說實驗失敗就會被推爆了
05/22 07:54, 30F

05/22 07:57, 5年前 , 31F
我4真的看不懂 我也覺得那隻賊應該第一 讚讚讚
05/22 07:57, 31F
我也很討厭台灣保時捷ZZ ※ 編輯: s90720eric (220.133.138.191), 05/22/2019 08:05:19

05/22 08:05, 5年前 , 32F
請用統計資料 水在-100~200溫度下的物理現象說明 只會達
05/22 08:05, 32F

05/22 08:05, 5年前 , 33F
到P值大於0.05 難道你要告訴大家「水是假的」?
05/22 08:05, 33F
你的樣本資料? 你真的懂這p-vaule代表什麼嗎? 不要亂用 拜託去讀點書再來 ※ 編輯: s90720eric (220.133.138.191), 05/22/2019 08:12:08

05/22 08:35, 5年前 , 34F
跟我想得差不多,給推
05/22 08:35, 34F

05/22 08:46, 5年前 , 35F
無效是「不足成為模型參數」? 然而相對參考參考性是
05/22 08:46, 35F

05/22 08:46, 5年前 , 36F
有的
05/22 08:46, 36F
不是 是進行檢定的前提就不符合了 如果不是常態分配 是奇怪某分配 那麼進行檢定就沒有意義 這次 Normality assumption 是在於 conditional distribution of y given 車輛 這是必須的 當然可以單純看高低 只是很難下說 他跟其他組是有所不同的結論 ※ 編輯: s90720eric (114.136.57.191), 05/22/2019 09:11:45

05/22 09:07, 5年前 , 37F
推,這實驗的人為因素變動太大,秒數差異太多,應該由
05/22 09:07, 37F

05/22 09:08, 5年前 , 38F
專業車手來開,讓人為因素降低再來評斷
05/22 09:08, 38F
人為可以有變動 但應該要每個人的變動幅度差不多這樣

05/22 09:09, 5年前 , 39F
05/22 09:09, 39F

05/22 09:13, 5年前 , 40F
在用anova前,可以先用k-w檢定變異數是否同質喔
05/22 09:13, 40F

05/22 09:13, 5年前 , 41F
也許不能用anova
05/22 09:13, 41F
你沒拉到下面XD 我用Bartlett test ※ 編輯: s90720eric (114.136.57.191), 05/22/2019 09:16:21

05/22 09:15, 5年前 , 42F
說錯,是anova和k-w檢定取其一
05/22 09:15, 42F

05/22 09:16, 5年前 , 43F
Leven test 才是檢定變異數
05/22 09:16, 43F

05/22 09:35, 5年前 , 44F
你把駕駛者的測試成績依照駕駛順序排列,然後剔除S5,就
05/22 09:35, 44F

05/22 09:36, 5年前 , 45F
會發現幾乎全部駕駛者的成績每趟都在縮短,這說明多數網
05/22 09:36, 45F

05/22 09:36, 5年前 , 46F
友還在適應場地跟車子,測試其實還未收斂
05/22 09:36, 46F

05/22 09:43, 5年前 , 47F

05/22 09:44, 5年前 , 48F
大概會像這樣,這測試方法比較像評人而不是評車
05/22 09:44, 48F

05/22 09:58, 5年前 , 49F
鄉民又在浪費才能了...
05/22 09:58, 49F

05/22 10:13, 5年前 , 50F
01今天早上有發另一篇金卡那測試,是後來補測的那場,
05/22 10:13, 50F

05/22 10:13, 5年前 , 51F
裡面有教練跟01編輯的成績
05/22 10:13, 51F

05/22 10:15, 5年前 , 52F
可惜補評測沒ES
05/22 10:15, 52F

05/22 10:16, 5年前 , 53F
推m996360
05/22 10:16, 53F

05/22 10:20, 5年前 , 54F
樣本數過少用拔靴法看看
05/22 10:20, 54F

05/22 10:29, 5年前 , 55F
最佳解不就是四個人隨機開來取樣嗎?
05/22 10:29, 55F

05/22 11:12, 5年前 , 56F
你只是為了統計分析而分析,一開始結論就說人家的測試失敗
05/22 11:12, 56F

05/22 11:12, 5年前 , 57F
你要說人家測試失敗也該是把以前跑過同樣金卡納測試的成績
05/22 11:12, 57F

05/22 11:13, 5年前 , 58F
列入,比較過後說這次成績偏差太多才能說這次測試結果失敗
05/22 11:13, 58F

05/22 11:14, 5年前 , 59F
說中文?
05/22 11:14, 59F

05/22 11:55, 5年前 , 60F
這簡單 我早就知道了
05/22 11:55, 60F

05/22 14:33, 5年前 , 61F
這分析 可以! 有要找後面的原因嗎?
05/22 14:33, 61F

05/22 20:27, 5年前 , 62F
車就是給人開的啊...
05/22 20:27, 62F

05/22 20:27, 5年前 , 63F
今天如果是全自動駕駛,再來排除人為因素吧...
05/22 20:27, 63F
文章代碼(AID): #1Sv4Ax9k (car)