[問題] 求高手解救! 關於研究跑法(羅吉斯迴歸)

看板Statistics作者 (jill)時間9年前 (2015/06/11 23:12), 編輯推噓2(2068)
留言70則, 6人參與, 最新討論串1/1
各位統計的強者好! 小的最近run完實驗,現處於資料分析完的狀態,但仍有一些疑問。 首先,想跟大家告知一下,我研究的自變項與應變項 ,自變項為一個:(1)網頁上不同的"位置"(有6個位置;數類目變項) 應變項只有一個“被選擇與否”(有與沒有;數二元變項) 研究問題: (1)六個位置中,是不是某一個位置特別容易被選擇? 由於我的應變項為二元變項,因此我跑了"二元羅吉斯回歸"(自變項創虛擬變項) **因此,我目前“疑問”的點在於 ,因為每一位受測者一次會看到六個位置, 而他們的決策只有一個(意即選位置1就不會選位置2,3,4,5,6) 當依變項彼此牽制時,跑二元羅吉斯回歸是否適當? 若不適當,是否有其它跑法呢? 麻煩各位大大解惑了嗚嗚 目前資料結構>>> id (受測者編號) 位置 決策(0為有;1為沒有) 1 1 0 1 2 0 1 3 0 1 4 0 1 5 1 1 6 0 2 1 1 2 2 0 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.129.45 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1434035570.A.DA2.html

06/12 00:31, , 1F
multinomial regression如何?
06/12 00:31, 1F

06/12 00:47, , 2F
你的研究看起來只有 應變項 沒有自變項耶 因為所有人
06/12 00:47, 2F

06/12 00:47, , 3F
看到的都是相同的六個位置 你再想想你到底想分析什麼
06/12 00:47, 3F

06/12 00:48, , 4F
如果只是看這六個位子 有沒有哪個平均來說比較多
06/12 00:48, 4F

06/12 00:48, , 5F
那麼不需要用邏輯斯迴歸 試試看卡方檢定
06/12 00:48, 5F

06/12 06:14, , 6F
用不著 logistic regression.
06/12 06:14, 6F

06/12 06:15, , 7F
就你的設定, 是6選1的選擇, 這是 multinomial pop. 的問題.
06/12 06:15, 7F

06/12 06:16, , 8F
用卡方配適度檢定, H0: p1=p2=...=p6=1/6
06/12 06:16, 8F

06/12 06:18, , 9F
如果是6個位置可獨立選或不選, 而非6選1, 則屬於6個二項群
06/12 06:18, 9F

06/12 06:18, , 10F
體的問題, 也是用卡方檢定: 均齊性檢定. H0: p1=...=p6
06/12 06:18, 10F

06/12 06:20, , 11F
事實上你用 logistic regression, 就等於是後一種. 只是你
06/12 06:20, 11F

06/12 06:21, , 12F
的設定是一個多項群體, 而非6個二項群體, 因此不適用後一種
06/12 06:21, 12F

06/12 06:23, , 13F
如果有瀏覽者特性資料為解釋變項, 或以瀏覽時間為解釋變項,
06/12 06:23, 13F

06/12 06:24, , 14F
反應變項是那6選1的選擇, 就用1F說的 multinomial reg.
06/12 06:24, 14F

06/12 10:59, , 15F
這解釋真詳細 真棒:D
06/12 10:59, 15F

06/12 14:55, , 16F
感謝以上回答的大大(哭)。我現在有較清楚的方向。
06/12 14:55, 16F

06/12 14:58, , 17F
然而我仍然有兩個問題。(1)執行卡方檢定時,一般一位
06/12 14:58, 17F

06/12 15:01, , 18F
受測者的自變項只有一個值,如檢視不同居住地區的政黨
06/12 15:01, 18F

06/12 15:05, , 19F
是否不同,一位參與者不是住北就是中或南。然而,現在參
06/12 15:05, 19F

06/12 15:07, , 20F
與者一次會看到六個位置,不知道這樣的資料結構跑卡方是
06/12 15:07, 20F

06/12 15:09, , 21F
適當?另,因為我有測每個位置的瀏覽時間,因此想設為解
06/12 15:09, 21F

06/12 15:10, , 22F
釋變項,請問我在跑Multinomial時,是分別將六個位置的
06/12 15:10, 22F

06/12 15:13, , 23F
瀏覽時間設為自變項(factor那一欄會有六個值),依變項
06/12 15:13, 23F

06/12 15:15, , 24F
依變項為參與者的選擇(位置1或23..,以位置1作為參考)
06/12 15:15, 24F

06/12 15:15, , 25F
這樣下去跑嗎? 再麻煩解惑了!嗚嗚嗚
06/12 15:15, 25F

06/12 18:08, , 26F
如果實驗設計成每個受測者都只能6選1,那問題(1) pass
06/12 18:08, 26F

06/12 18:12, , 27F
問題(2)可能可行,但要注意假重覆問題。
06/12 18:12, 27F

06/12 18:53, , 28F
時間共變數是否要做適當轉換也可能要先想清楚。
06/12 18:53, 28F

06/12 18:54, , 29F
因為我猜想你關心的可能不是絕對時間長,而是受測者內的
06/12 18:54, 29F

06/12 18:54, , 30F
相對時間長。
06/12 18:54, 30F

06/12 23:18, , 31F
感謝andrew43回答!!但我目前跑出來的結果感覺有點怪。
06/12 23:18, 31F

06/12 23:23, , 32F
現在跑出來的結果的總數是240而非40(我的樣本是40),但
06/12 23:23, 32F

06/12 23:24, , 33F
就是我所謂的假重複問題。
06/12 23:24, 33F

06/12 23:26, , 34F
6個位置(列)下的總和是40(選擇與否是欄;位置為列)
06/12 23:26, 34F

06/12 23:28, , 35F
不知道這樣結果是否正確 ヽ(゚Д`)ノ゚
06/12 23:28, 35F

06/12 23:29, , 36F
我不知道如何完全解決。可能要考慮受測者這個隨機因子。
06/12 23:29, 36F

06/12 23:32, , 37F
但我對實驗方法不是完全了解。不能做更多假設來推測了。
06/12 23:32, 37F

06/12 23:34, , 38F
喔!!我瞭解了。我再自行思考如何解決假重複性的問題。感
06/12 23:34, 38F

06/12 23:34, , 39F
謝你壓~~
06/12 23:34, 39F

06/13 03:56, , 40F
6個選擇只能選一個, 是多項群體, 算是多變量, 而不是 6 個
06/13 03:56, 40F

06/13 03:57, , 41F
cases. 至於考慮有 response-dependent 的解釋變項, 印象中
06/13 03:57, 41F

06/13 03:58, , 42F
(很久很久以前的記憶了) 有所謂 conditional-logit model,
06/13 03:58, 42F

06/13 04:00, , 43F
好像就是分析這種資料的. (不過我也無法確定這記憶有沒錯.)
06/13 04:00, 43F

06/13 04:01, , 44F
上面的 "response-dependent" 正確說法好像應該是 choice-
06/13 04:01, 44F

06/13 04:01, , 45F
dependent.
06/13 04:01, 45F

06/13 04:47, , 46F
看來yhliu大說得沒錯。參考 http://tinyurl.com/p9p2g7a
06/13 04:47, 46F

06/13 04:51, , 47F
該方法也可推廣到多項式反應變數,如上述網頁 Example 2
06/13 04:51, 47F

06/13 05:11, , 48F
我對照了好幾個例子,都和你的資料相似。看來就是yhliu
06/13 05:11, 48F

06/13 05:11, , 49F
大說的方法沒錯。
06/13 05:11, 49F

06/13 05:12, , 50F
我也長知識了。
06/13 05:12, 50F

06/13 18:53, , 51F
感謝yhliu與andrew43的回答。andrew43貼的網址我仔細研
06/13 18:53, 51F

06/13 18:55, , 52F
研了一個下午,確實可行,感謝。只是若我只想知道這六
06/13 18:55, 52F

06/13 18:56, , 53F
個位置被選擇的機率,使用條件邏輯model,我就不知道我
06/13 18:56, 53F

06/13 18:58, , 54F
的解釋變項為何,我剛剛想了想,若我只是單純想知六個位
06/13 18:58, 54F

06/13 18:59, , 55F
被選擇的機率是否不同,不知道是否可以用Repeated
06/13 18:59, 55F

06/13 19:00, , 56F
measure ANOVAl跑呢???
06/13 19:00, 56F

06/13 20:20, , 57F
repeated measure Anova 不太適合二元變數,也不一定有c
06/13 20:20, 57F

06/13 20:20, , 58F
hoice dependent 的內涵。
06/13 20:20, 58F

06/14 15:11, , 59F
單純看6者之中何者被選機率較大, 不就一開始說的, 卡方配適
06/14 15:11, 59F

06/14 15:12, , 60F
度檢定 H0: p1=...=p6 = 1/6.
06/14 15:12, 60F

06/14 21:04, , 61F

06/14 21:07, , 62F
https://goo.gl/Xffr1h 我用卡方跑了。但覺得結果怪怪的
06/14 21:07, 62F

06/14 21:08, , 63F
感覺總和應該40,而非240!!??
06/14 21:08, 63F

06/15 00:57, , 64F
錯了。簡單說,只分析y=1的資料。
06/15 00:57, 64F

06/15 00:58, , 65F
也就是檢驗7:10:5:1:10:7 是不是 1:1:1:1:1:1。
06/15 00:58, 65F

06/15 00:59, , 66F
你再想想看。感覺你沒有完全了解y大的意思。
06/15 00:59, 66F

06/15 10:28, , 67F
喔我好像了解了!!這樣我是不是改用"無母數卡方跑"呢?!
06/15 10:28, 67F

06/15 10:29, , 68F
就只針對分析Y=1的部分!
06/15 10:29, 68F

06/15 10:37, , 69F
06/15 10:37, 69F

06/15 18:58, , 70F
沒錯。
06/15 18:58, 70F
文章代碼(AID): #1LUQLosY (Statistics)