[問題] "0"的影響力? (代po)

看板Statistics作者 (牛奶刺蝟)時間10年前 (2016/01/24 17:38), 編輯推噓2(2054)
留言56則, 4人參與, 最新討論串1/1
以下內容幫朋友代po ↓ ------------------------------------------------ 大家好~ 有些統計上的問題我思考了許久仍不確定這樣的想法是否正確, 因此想尋求大家的見解。 (文略長請見諒) 在我的研究中需要做到中介效果, 然而在檢驗中介效果之前必須符合些基本假設, 而我也已經做了檢驗確定其符合這些前提假設, 但是其中有些比較特別的狀況讓我有些疑惑, 這裡說明以X為自變項,Y為依變項,M為中介變項, 我的Y值是用二元式量表計分而得, 亦即Y值是由每一題回答為「是」或「否」的題目組合而成, 而我在計分時將「是」計為1分,「否」計為0分, 最後所有題項加總的分數即為Y值。 我那個時候也很猶豫這樣的狀況我到底是應該要把Y視為類別變項嗎? 但是由於它又不是只以一題作為分析, 而是以量表中每一題的回答加總做為總分, 所以我依舊將其視為連續變項進行分析, 而測量M值的量表是採用李克特氏量表進行計分, 問題是: 由於用來測量Y值的量表和用來測量M值的量表, 其組成的每一題題項回答數值皆以「0」為起始分, 亦即受試者有圈選0的可能, 而結果也發現有一部份受試者在Y和M的總分為0, 因為擔心這樣的情況會影響分析結果, 所以就把可能的預測配對結果都試跑看看, 亦即將測量Y值和M值的量表每一題修正為從「1」開始計值。 結果發現, 因為有部分的受試者在Y和M的得分都是0, 結果若兩者都以原始方式計分(以0為起始分), M對Y的解釋力為14%, 但是若是以調整後的方式分析, 不論是M值從1開始、Y維持從0開始, 或是M和Y皆改為從1開始, M對Y的解釋力都只剩下4%, 但其效果皆達顯著, 因此想說是不是兩者皆為0的緣故導致調整後R^2嚴重膨脹? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.56.143 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1453628303.A.6E7.html

01/25 00:39, , 1F
you need to use logit reg
01/25 00:39, 1F

01/25 03:27, , 2F
怪怪的。平移和伸縮應該不會改變相關程度。
01/25 03:27, 2F

01/25 03:28, , 3F
你要不要檢查一下你在改變分數的過程有沒有出錯?
01/25 03:28, 3F

01/25 13:17, , 4F
andrew43大大你這麼一說我就有概念了(我對圖型的理解力
01/25 13:17, 4F

01/25 13:17, , 5F
比較好~抱歉),我晚點再重新確認跑跑看,謝謝!
01/25 13:17, 5F

01/25 13:18, , 6F
evilove大大,如果我用來測量Y的量表有加總分也要當它是
01/25 13:18, 6F

01/25 13:18, , 7F
類別嗎?
01/25 13:18, 7F

01/25 16:34, , 8F
我重新確認後還是一樣的結果TAT
01/25 16:34, 8F

01/25 16:36, , 9F
「原始M對原始Y」和「原始M對調整後的Y」其調整後R^2皆
01/25 16:36, 9F

01/25 16:37, , 10F
為14%,但「調整後M對調整後Y」和「調整後M對原始Y」皆
01/25 16:37, 10F

01/25 16:37, , 11F
降為4%。
01/25 16:37, 11F

01/25 23:16, , 12F
看錯,你要先看Y的分佈再決定方法
01/25 23:16, 12F

01/26 15:37, , 13F
如果Y的母群違反常態的可能性很高,是不是需要換成無母
01/26 15:37, 13F

01/26 15:37, , 14F
數的迴歸方法才是正確的?
01/26 15:37, 14F

01/27 16:29, , 15F
不一定需要用無母數方法. 比較需要考慮的是加總得的分數是
01/27 16:29, 15F

01/27 16:30, , 16F
否確實有意義. 至於是用 0-1 去計分加銠, 或用 1-2 去計分
01/27 16:30, 16F

01/27 16:32, , 17F
加總, 或仍是0-1計分加總但總分再加 1, 結果應泗應響迴歸式
01/27 16:32, 17F

01/27 16:32, , 18F
的常數項.
01/27 16:32, 18F

01/27 21:36, , 19F
聽到不一定要用無母數的方法覺得好感動喔~謝謝你們,
01/27 21:36, 19F

01/27 21:36, , 20F
至少讓我心安了一下!因為這幾天想說可能得認命點使用無
01/27 21:36, 20F

01/27 21:36, , 21F
母數的方法,嘗試去暸解後發現完全超出我的認知能力負
01/27 21:36, 21F

01/27 21:36, , 22F
荷範圍,而且相對好像也比較少人去論述無母數的迴歸。
01/27 21:36, 22F

01/27 21:56, , 23F
不過不曉得方不方便再讓我嘗試澄清其中的資訊,因為我
01/27 21:56, 23F

01/27 21:56, , 24F
擔心有些小地方我不小心誤解了您的意思? 我的Y其實代
01/27 21:56, 24F

01/27 21:56, , 25F
表著是臨床上若受試者勾選有出現量表中描述狀況的幾項,
01/27 21:56, 25F

01/27 21:56, , 26F
以反應其因疾病受影響的程度,所以即便結果總分是0,應
01/27 21:56, 26F

01/27 21:56, , 27F
該...在我的研究中是有意義的才是。這只是我自己的想法
01/27 21:56, 27F

01/27 21:56, , 28F
,也許不盡然是對的,如果有其它的觀點我也很樂意聽聽
01/27 21:56, 28F

01/27 21:56, , 29F
看,也許會讓我有機會發現自己的盲點:)
01/27 21:56, 29F

01/27 22:05, , 30F
所以我想暸解的是,如果我設定的分數是有意義的前提之下
01/27 22:05, 30F

01/27 22:05, , 31F
,那麼即便我的Y並非呈常態分配的話(其實我一直再想雖然
01/27 22:05, 31F

01/27 22:06, , 32F
我的抽樣樣本約150份,呈現非統計學上常提的鐘型常態,
01/27 22:06, 32F

01/27 22:06, , 33F
但我認為依據我想探究的現象,它其實母群幾乎也不太可
01/27 22:06, 33F

01/27 22:09, , 34F
能是鐘型常態,反而比較可能是呈現我搜集到的樣本分布
01/27 22:09, 34F

01/27 22:09, , 35F
狀態),也能夠使用線性迴歸的關鍵原因為何?
01/27 22:09, 35F

01/28 07:46, , 36F
回到問題本身。我還是覺得平移不會造成此問題。
01/28 07:46, 36F

01/28 07:47, , 37F
所以我之前才會請你檢查你資料是不是出錯了。
01/28 07:47, 37F

01/28 07:49, , 38F
要不要把再多統計結果報表貼出來看看?
01/28 07:49, 38F

01/28 11:17, , 39F
http: //ppt.cc/7j7gZ
01/28 11:17, 39F

01/28 11:18, , 40F
上面這個網址是我M和Y皆用原始值計算分析出來的結果,因
01/28 11:18, 40F

01/28 11:19, , 41F
為原始縮圖網址被PTT系統判定為暫停使用,因此我在http:
01/28 11:19, 41F

01/28 11:19, , 42F
後方多增加了一個空格:)
01/28 11:19, 42F

01/28 11:23, , 43F
http: //ppt.cc/PYHKg 此則為使用調整後數值的結果
01/28 11:23, 43F

01/28 11:24, , 44F
不知道圖片中的資料是否足夠判斷問題所在?
01/28 11:24, 44F

01/28 11:44, , 45F
我剛剛找到問題所在了!因為有兩個預設系統轉換(調整)值
01/28 11:44, 45F

01/28 11:46, , 46F
整個跳掉,導致被判讀成遺漏值,剛剛用人工補植的方式進
01/28 11:46, 46F

01/28 11:46, , 47F
行修正後再重跑一次就好了! 結果都是14%,是我太粗心了
01/28 11:46, 47F

01/28 11:48, , 48F
對不起 v v 想說奇怪怎麼樣本數會不一樣。
01/28 11:48, 48F

01/28 11:51, , 49F
不過我還是很想知道如果樣本和母群皆未常態,那麼依舊可
01/28 11:51, 49F

01/28 11:52, , 50F
以使用linear regression的原因為何?
01/28 11:52, 50F

01/29 02:33, , 51F
不要用這個圖床,題外話。
01/29 02:33, 51F

01/29 02:36, , 52F
一般線模的前題是殘差獨立且常態。看殘差分配像不像常態
01/29 02:36, 52F

01/29 02:36, , 53F
看看。
01/29 02:36, 53F

01/29 11:48, , 54F
我有檢測過residual plots,不論是原始資料或是嘗試使用
01/29 11:48, 54F

01/29 11:49, , 55F
課本上提到可以用來治療非常態的轉換方式,像是平方根、
01/29 11:49, 55F

01/29 11:50, , 56F
立方、平方都試過,依舊無法使之成常態。
01/29 11:50, 56F
文章代碼(AID): #1Mf9kFRd (Statistics)