Re: [問題]spearman rank cor跑出來1 or 0.99

看板Statistics作者 (Nikita~)時間1年前 (2023/04/19 16:35), 1年前編輯推噓1(1038)
留言39則, 3人參與, 1年前最新討論串2/2 (看更多)
※ 引述《riviera (Nikita~)》之銘言: 因為樣本很小,大概8~9個,跑了spearman correlation, adjusted for 4 other variables ; 結果跑出幾個p < 0.05的結果, 但是rho = -1, 1, or 0.99 ; 請問這是可以report的嗎? 總覺得怪怪的 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.74.68 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1681779063.A.18A.html ※ 編輯: riviera (36.226.74.68 臺灣), 04/18/2023 08:53:24

04/18 09:36,
或許可以看看Spearman correlation test的power ana
04/18 09:36

04/18 09:36,
lysis
04/18 09:36

04/18 16:31,
極端的spearman相關係數就表示二變項的大小順序幾乎完全
04/18 16:31

04/18 16:33,
遞增或遞減。從精確檢驗來說,只要5對順序為絕對遞增或
04/18 16:33

04/18 16:34,
遞減的資料就能達到p<0.05了,而你的情況可能是絕對遞增
04/18 16:34

04/18 16:36,
或遞減有8-9對資料,那exact p-value已經到超級小了。
04/18 16:36

04/18 16:38,
(N=8, rho=1, exact p-value=0.00005)
04/18 16:38

04/18 16:40,
總之,雖然樣本很小,但隨機配對出你的結果的機率很小。
04/18 16:40

04/18 16:41,
這已經是有統計意義了。不知道有沒有解釋了你說的「怪」
04/18 16:41

04/18 17:06,
另外,這種超小的樣本,我建議用exact p-value而不要用
04/18 17:06

04/18 17:07,
asymptotic p-value。目前看不出來你選哪一個。
04/18 17:07
謝謝兩位版友的回答 1. power analysis 我來查查,不過似乎有人在討論minimun sample size for Pearson Spearman and Kendall. May, Justine O., and Stephen W. Looney. "Sample size charts for Spearman and Kendall coefficients." Journal of biometrics & biostatistics 11.2 (2020): 1-7. 2. 算出來的p value = 0.028, 0.014, 0.002; 我再來看看怎麼算 exact p value 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.75.28 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1681893335.A.632.html

04/20 08:37, 1年前 , 1F
才 8-9 個觀測值,還 adjust by 4 variables,當然呈現表面
04/20 08:37, 1F

04/20 08:39, 1年前 , 2F
層次的高相關值。假設兩變數是獨立的,共同用 4 個變數做線
04/20 08:39, 2F

04/20 08:41, 1年前 , 3F
性迴歸取殘差,則殘差間當然存在相關,因為其中有共同的那
04/20 08:41, 3F

04/20 08:42, 1年前 , 4F
些調整變數的成分。而樣本小使得相關係數高。p 值只是表明
04/20 08:42, 4F

04/20 08:44, 1年前 , 5F
其樣本相關結果是否來源於純機會因素,何況三個結果中也只
04/20 08:44, 5F

04/20 08:45, 1年前 , 6F
有第三個顯著性高些...但顯著性高也不代表相關度比較強,更
04/20 08:45, 6F

04/20 08:47, 1年前 , 7F
別說那相關性可能來自共同調整變數的原因。
04/20 08:47, 7F

04/20 08:53, 1年前 , 8F
建議:先不做調整看簡單相關是否存在;再就擬探討相關的變
04/20 08:53, 8F

04/20 08:56, 1年前 , 9F
數個別與調整變數間的關係;最後再分析經調整後的關係,除
04/20 08:56, 9F

04/20 08:58, 1年前 , 10F
非調整變數是離散型而調整方式是分組樣本,否則個人認為調
04/20 08:58, 10F

04/20 08:59, 1年前 , 11F
整時不必採同一模型。以迴歸調整為例,X 用 Z1 調整,Y 或
04/20 08:59, 11F

04/20 09:01, 1年前 , 12F
許用 Z2。因為樣本太小,不能用太多調整變數,尤其是 X, Y
04/20 09:01, 12F

04/20 09:02, 1年前 , 13F
都用相同變數調整時。
04/20 09:02, 13F

04/20 21:18, 1年前 , 14F
謝謝大大!所以你建議y用a變數adjust;x用b變數adjust;再
04/20 21:18, 14F

04/20 21:19, 1年前 , 15F
再算x,y之間的correlation?避免共同使用同樣cov. adjust
04/20 21:19, 15F

04/20 22:38, 1年前 , 16F
既然有模型,何不建模做回歸?否則這些調整過的關聯性
04/20 22:38, 16F

04/20 22:38, 1年前 , 17F
可能也是假的
04/20 22:38, 17F

04/20 22:48, 1年前 , 18F
但如果要先由這麼多個變數做調整,那也應該沒有檢驗可
04/20 22:48, 18F

04/20 22:48, 1年前 , 19F
做了,樣本數不夠。
04/20 22:48, 19F

04/21 08:02, 1年前 , 20F
本太小,看簡單相關都嫌小了,又用一堆不知是否確實有重要
04/21 08:02, 20F

04/21 08:03, 1年前 , 21F
如果樣本很大,X, Y 用幾個不很重要的變數做調整亦無妨;樣
04/21 08:03, 21F

04/21 08:03, 1年前 , 22F
本太小,看簡單相關都嫌小了,又用一堆不知是否確實有重要
04/21 08:03, 22F

04/21 08:05, 1年前 , 23F
關聯的變數調整,殘差自由度小了,而且有因調整所引入的共
04/21 08:05, 23F

04/21 08:07, 1年前 , 24F
同因素,再看殘差相關已失意義。但又怕簡單相關其中有虛假
04/21 08:07, 24F

04/21 08:08, 1年前 , 25F
關聯存在,因而想用其他變數調整,那就個別找最重要的調整
04/21 08:08, 25F

04/21 08:10, 1年前 , 26F
變數。若 X, Y 找到的調整變數相同,則在做殘差間相關時要
04/21 08:10, 26F

04/21 08:12, 1年前 , 27F
同時考慮其相關是否因調整產生的。即使 X, Y 之調整變數不
04/21 08:12, 27F

04/21 08:14, 1年前 , 28F
同,也要再看兩調整變數之關聯。個人意見是多看各變數間相
04/21 08:14, 28F

04/21 08:16, 1年前 , 29F
互的關聯,而後產生一個總體的,似乎合理的解釋。
04/21 08:16, 29F

04/21 08:17, 1年前 , 30F
或者,仍依正式的方法,用相同變數做調整,但只用一個調整
04/21 08:17, 30F

04/21 08:21, 1年前 , 31F
變數。可以4個變數一一去試,而後做出綜合的解釋。
04/21 08:21, 31F

04/21 08:22, 1年前 , 32F
以 n=9 來說,如果同時用4個變數調整 X, Y 而後分析 X, Y
04/21 08:22, 32F

04/21 08:24, 1年前 , 33F
的關聯,不談因調整而產生的共同因素,單論殘差各剩 4個自
04/21 08:24, 33F

04/21 08:26, 1年前 , 34F
由度,等於只剩4個樣本點,這樣算出來的相關指標焉能不虛高
04/21 08:26, 34F

04/21 18:19, 1年前 , 35F
同意老師的觀點。小樣本又要背後容許多個參數,沒有空
04/21 18:19, 35F

04/21 18:19, 1年前 , 36F
間做推論了。
04/21 18:19, 36F

04/21 18:23, 1年前 , 37F
更別說,小樣本做回歸調整,調整出來的東西不確定性很
04/21 18:23, 37F

04/21 18:23, 1年前 , 38F
也沒有納入之後的分析,覺得很不可靠。
04/21 18:23, 38F

04/21 20:26, 1年前 , 39F
謝謝大家的討論!我想就bivariate correlation
04/21 20:26, 39F
文章代碼(AID): #1aFwVNOo (Statistics)
文章代碼(AID): #1aFwVNOo (Statistics)