[問題] 再問幾個統計問題

看板Statistics作者 (哥的小辣椒)時間7年前 (2018/10/25 16:02), 7年前編輯推噓8(8011)
留言19則, 4人參與, 7年前最新討論串1/1
如果是跟統計軟體有關請重發文章,使用程式做為分類。 統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 為避免版面混亂,請勿手動置底問題,善用E做檔案編輯 不好意思還是有幾個想請教(最後一問) 1. Likelihood ratio test的使用時機,以及其與Neyman-Pearson lemma的關係。 因後者根據我淺薄的認知是,LRT就是其中一種強力檢定,而要是未知母體分配則可以使 用此檢定。那為何較少看到檢定中使用LRT,而是較常看到t,F,chisq等檢定?既然是最強 力檢定為何不都考慮LRT檢定就可?還是說是主要是看data符合哪一種檢定的假設,才是 較適合該檢定的準則。 2. In logistic regression assumption: 因為已並非線性Model(根本沒有error),因此模型前提假設應該已不需要error~~Normal and E(error)=0、Var(error)=sigma^2 ,應該只剩下Cov(errori , errorj)=0 for each i not equal to j 以及變項間線性獨立(不能有共線性存在)。不知道我這樣認為是否正 確? 3. 變異數同質性檢定in ANOVA and Linear regression: 在線性Regression中,有提到其中一個假設是Var(ei)~sigma^2,而檢定誤差變異數是否 同質則可以利用error做White test。 而我的認知是,檢定誤差變異數是否同質是不等價於檢定解釋變數之間是否變異數同質的 。 但是,在ANOVA中,我則在某書上看到了進行Model adequancy checking(變異數同質診斷 )中,看到了三種檢定方法:Bartlett's test 、Hartley test、Levene's test,但這些 Ho都是假定ANOVA檢定中K個母體的變異數是否相等。 這跟我的認知違背了,我認為在Linear regression中檢定解釋變數之間變異數是否同質 無法等價於error是否符合模型變異數同質的假設,因在Linear Regression中就已經假定 殘差獨立於各解釋變數了。但是在ANOVA中,其模型假設也是Var(eij)=sigma^2 ,但是其 模型診斷的變異數同質檢定卻不是針對error檢定,而是直接診斷獨立母體之間變異數是 否同質。 不知道是否是因為,ANOVA中並沒有假設彼此之間有一個函數關係(不像Linear Regressio n中的Y~X1+X2..),因此檢定變異數同質自然等價於檢定K個母體變異數 是否相等,而Linear Regression則反之,擁有解釋變數的存在,也擁有假設解釋變數與Y 存在某種函數關係,因此檢定變異數同質自然只能針對這個「Linear Regression fittin g line」的error做檢定? 4. Logistic regression中的Deviance: Logistic regression中的Deviance,其類比於Linear regression中的MSE(SSE),因此原 則上若Deviance越小,則模型的解釋力越好(不知道我這樣認知是否正確?) 非常謝謝各位大大的指點。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.8.133.223 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1540454530.A.955.html

10/25 16:22, 7年前 , 1F
3. 單因子ANOVA為例,各組資料減去各自的平均就是殘差。
10/25 16:22, 1F
我知道有這個,但是好奇的是我那樣的認知是否正確QQ(ANOVA中檢定error變異數同質可 以等價於檢定k個母體是否變異數同質),又或是我被書誤導了,又或是我是個白癡QQ,因 為時間有點著急(但並非作業或考試)因此才上來問。 ※ 編輯: a22735557 (39.8.133.223), 10/25/2018 16:29:59 ※ 編輯: a22735557 (39.8.133.223), 10/25/2018 17:33:50

10/25 20:14, 7年前 , 2F
1.因為LRT所得到的拒絕域無法保證具有最大檢定力,而mp
10/25 20:14, 2F

10/25 20:14, 7年前 , 3F
t umpt可以,所以情況允許的話不會用LRT。另外LRT的使
10/25 20:14, 3F

10/25 20:14, 7年前 , 4F
用情形是1.當該檢定不具有最大檢定力時2.除了虛無假設
10/25 20:14, 4F

10/25 20:14, 7年前 , 5F
與對立假設中有興趣討論的參數外,母體還有其他未知的
10/25 20:14, 5F

10/25 20:14, 7年前 , 6F
參數。
10/25 20:14, 6F

10/25 20:16, 7年前 , 7F
N-P lemma常用於mpt與umpt中
10/25 20:16, 7F

10/26 01:36, 7年前 , 8F
4. 和R2一樣,塞一堆沒關係的自變數也能增加解釋力。
10/26 01:36, 8F

10/26 01:37, 7年前 , 9F
所以不總是越小越好。
10/26 01:37, 9F

10/26 08:18, 7年前 , 10F
3. 每組資料都是一樣的變異數,不同平均值,所以檢
10/26 08:18, 10F

10/26 08:18, 7年前 , 11F
定每組資料的變異數是否相等等同於檢定殘差變異數
10/26 08:18, 11F

10/26 08:19, 7年前 , 12F
回歸分析會要求檢驗殘差是因為殘差才是獨立同分配,
10/26 08:19, 12F

10/26 08:19, 7年前 , 13F
所以三大假設都檢驗殘差即可,不然變異數均值性看y
10/26 08:19, 13F

10/26 08:20, 7年前 , 14F
其實無不妥,但是常態就不能看y,因為每一個y的平均
10/26 08:20, 14F

10/26 08:20, 7年前 , 15F
值不同,非同分配
10/26 08:20, 15F

10/30 12:26, 7年前 , 16F
2. 沒有error是因為我們承認參數(固定的值不是隨機變
10/30 12:26, 16F

10/30 12:26, 7年前 , 17F
數)的某種轉換會是covariates的線性組合,然後對於任
10/30 12:26, 17F

10/30 12:26, 7年前 , 18F
何模型來說,一般都會允許一定程度的共線性,不能有共線
10/30 12:26, 18F

10/30 12:26, 7年前 , 19F
性條件太嚴格了這會導致模型無用武之地
10/30 12:26, 19F
文章代碼(AID): #1RqNY2bL (Statistics)