[問題] 請為為何不能用百分比(% data)跑ANOVA?

看板Statistics作者 (youchen)時間9年前 (2016/10/19 10:30), 編輯推噓3(3035)
留言38則, 6人參與, 最新討論串1/1
想請問一個基本問題 我的指導老師一直說不能用百分比去跑ANOVA, 但是問他理由時也說不出個所以然來... 自己上網查了一下,有人說可以,也有人說不行。 後來有查到這一篇 http://goo.gl/Ro4ULj, 回文者有說There is a more and more strongly emerging consensus that you cannot analyze percentage data with ANOVA. 還附上兩篇文獻 但小弟我統計知識淺薄,回文者也沒有說明原因 想請問在座的各位大大,是否可為小弟我指點迷津? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 160.252.170.14 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1476844216.A.86F.html

10/19 10:52, , 1F
什麼東西的百分比?你可能誤會那二篇文章的用意了。
10/19 10:52, 1F

10/19 10:53, , 2F
另外,可以查查ANOVA的使用前題。
10/19 10:53, 2F

10/19 10:55, , 3F
先說明你的百分比是怎麼來,討論會更有意思。
10/19 10:55, 3F

10/19 11:37, , 4F
不好意思,那兩篇我實在是有看沒有懂才會來此發問...
10/19 11:37, 4F

10/19 11:38, , 5F
數據是某行為的實行時間佔一天總時間的多少%
10/19 11:38, 5F

10/19 11:39, , 6F
但我老師說單位是%的東西不能去跑ANOVA..
10/19 11:39, 6F

10/19 11:40, , 7F
或是頻率(次/hr)之類也不能用....但不知道為什麼...
10/19 11:40, 7F

10/19 12:01, , 8F
anova有個假設是各樣本間要互相獨立, 你的數據如果某一組
10/19 12:01, 8F

10/19 12:02, , 9F
是某行為的實行時間佔一天總時間的多少%, 就不是互相獨
10/19 12:02, 9F

10/19 12:04, , 10F
立了. 而且應該也不會是常態分布
10/19 12:04, 10F

10/19 12:07, , 11F
如果你的數據大多靠近0/100之類的話也不適合
10/19 12:07, 11F

10/19 12:12, , 12F
為什麼你不要直接作卡方檢定就好了?
10/19 12:12, 12F

10/19 14:27, , 13F
所以你的重點不是「百分比」。若總時間都是24小時,那我
10/19 14:27, 13F

10/19 14:28, , 14F
說某行為進行的「時間長」不就是你的「百分比×24」
10/19 14:28, 14F

10/19 14:29, , 15F
所以你想比較什麼?ANOVA的因子是什麼?
10/19 14:29, 15F

10/19 14:30, , 16F
是同一種行為在不同受測單位間的比較嗎?
10/19 14:30, 16F

10/19 14:30, , 17F
還是想比較不同行為的時間長短?
10/19 14:30, 17F

10/19 14:31, , 18F
這會關係到sweetJ談及的主題,需要一起討論。
10/19 14:31, 18F

10/19 21:44, , 19F
用 Anova 本身就是...
10/19 21:44, 19F

10/19 22:35, , 20F
那請問,我想比較在三種不同環境下,小牛(同齡)遊戲行為
10/19 22:35, 20F

10/19 22:38, , 21F
佔一天當中的百分比是否有差異。我的因子是三種飼養環境
10/19 22:38, 21F

10/19 22:40, , 22F
比如說飼養在A的小牛平均一天有20%的時間在玩...
10/19 22:40, 22F

10/19 22:42, , 23F
這樣也不能用ANOVA嗎?看似相互獨立...
10/19 22:42, 23F

10/20 02:06, , 24F
應該是自由度的關係 會讓取百分比與取原值不成比例
10/20 02:06, 24F

10/20 02:06, , 25F
關係 以致檢定結果有差異
10/20 02:06, 25F

10/20 02:39, , 26F
想想好像也不是 理論上結果應是一樣或許是會有計算誤
10/20 02:39, 26F

10/20 02:39, , 27F
差?受限計算工具 當資料大到例如百萬個可能會影響
10/20 02:39, 27F

10/20 02:39, , 28F
結果?
10/20 02:39, 28F

10/20 03:26, , 29F
你說的這種between-subjects 單一行為的百分比比較
10/20 03:26, 29F

10/20 03:27, , 30F
當然可以用ANOVA 只要確定ANOVA條件合就好了
10/20 03:27, 30F

10/21 08:23, , 31F
可以考慮ANOVA,不全然是你貼出的文章所考慮的情況。
10/21 08:23, 31F

10/21 08:24, , 32F
但如果比較了行為A又想比較為B,就要考慮多變量了。
10/21 08:24, 32F

10/24 09:34, , 33F
你的例子是互相獨立, 但是為什麼一定要用比例呢?
10/24 09:34, 33F

10/24 09:35, , 34F
既然分母都是一天24H, 你直接用一天小牛有幾個小時在玩
10/24 09:35, 34F

10/24 09:35, , 35F
去做ANOVA檢定不就好了?
10/24 09:35, 35F

10/24 09:38, , 36F
除此之外你還是可以直接做卡方檢定, 我看不出來你一定要去
10/24 09:38, 36F

10/24 09:39, , 37F
用ANOVA檢定百分比平均值的道理?
10/24 09:39, 37F

10/24 10:04, , 38F
分母是固定值有沒有用百分比有差嗎XD
10/24 10:04, 38F
文章代碼(AID): #1O1jguXl (Statistics)