Re: [問題] SEM用PLS跑的問題與優缺點?

看板Statistics作者 (這其中一定有什麼誤會)時間16年前 (2009/05/14 16:54), 編輯推噓0(0012)
留言12則, 2人參與, 7年前最新討論串7/10 (看更多)
: 不知道是否有其他比較強(多)的證據或文獻可以證明 resample size 設越大越好? : : 以下引用 chin(2001)的 PLS-Graph User's Guide 內容片段 : (已有 MIS 領域不錯的 Journal paper 引用) : The default Bootstrap options are 100 resamples with each sample consisting of the same number of : cases as your original sample set. The bootstrap procedure samples with replacement from your : original sample set. It continues to sample until it reaches the number of cases you specify (or the : default). This procedure is repeated until it reaches the number of bootstrap resamples you specify (or : the default of 100). In general, resamples of 200 tend to provide reasonable standard error estimates. : : 以下是快速找到的幾篇 MIS papers : Resample = 100 : Henry, R.M., McCray, G.E., Purvis, R.L. Roberts, T.L. (2007) "Exploiting Organizational Knowledge in Developing IS Project Cost and Schedule Estimates: An Empirical Study", Information & Management, Vol. 44 No.6, pp.598-612. : : Resample = 500 : Ko, D., Kirsch, J.L., King, W.R. (2005) "Antecedents of knowledge transfer from consultants to clients in enterprise system implementations", MIS Quarterly, Vol. 29 No.1, pp.59-85. : : Resample = 100 & 500 : Goodhue, D., Lewis, W., and Thompson, R., (2007) "Statistical Power in Analyzing Interaction Effects: Questioning the Advantage of PLS With Product Indicators", Information Systems Research, Vol. 18 No.2, pp.211-227. : : 也許 Goodhue et al.(2007) 這篇是答案, 但我找不到 pdf 檔可以看(汗) : → bmka:這個問題沒那麼複雜吧,先把bootstrap方法原理弄懂 05/12 23:01 : → bmka:resample 數目當然越大越好,至於要多大,那要看data distribut 05/12 23:03 : → bmka:跑久一點不會吃虧的 05/12 23:04 對於我來說 PLS 只是一個工具而已 我只要知道如何使用及瞭解它的假設及限制, 而能產出 outcome 並解讀就可以了 如同您會操作電腦, 但您知道半導體是如何製造的嗎? 畢竟電腦只是一個工具而已 也許您只是站在純數學的觀點來看, 認為 resample 設越大越好 但這樣反而太過操弄統計這個工具了, 這樣統計的結果真的就是事實的結果嗎? 如果您可以提供文獻證明 resample 設越大越好, 那我也可以修正我原來的看法. 若如您所言, 對於 resample 設越大越好, 我一個合理的懷疑 那麼這許多作研究的學者應該會有人提到這點, 但是並沒有 ... 至少我看過的 papers 沒人提到此點 而且我相信這些學者的電腦應該不會太差, resample 設100萬也不是問題才對 所以我認為這並不是電腦執行速度的問題 我後來還是找到了 Goodhue et al.(2007) 這篇 pdf 檔 (ISR 在 MIS 排前五大期刊) 也許底下的片段可以解答您的問題, 所以我的建議還是設 500 比較恰當 因為這是大多數學者所使用的數值 It might be suggested that we should use bootstrapping with 500 resamples (rather than 100). Five hundred resamples is the usual recommendation when using bootstrapping to estimate a parameter using a single sample (Chin 1998). However, we draw 500 samples (500 researchers) from the same population for each cell in our analysis, and use bootstrapping with 100 resamples on each of those. This amounts to 50,000 resamples for each cell, and hence we expect that moving from 50,000 to 250,000 resamples in each cell would not affect the outcome. -- Keroro軍曹對多啦a夢說: PTT星球上有二國人... 一種是自認與其他人不同國的人 另一種是認為大家都是同一國的人 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.254.33.185 ※ 編輯: danny789 來自: 122.254.33.185 (05/14 16:56)

05/16 01:47, , 1F
很明顯的, 你不懂bootstrap....
05/16 01:47, 1F

05/16 01:48, , 2F
請看chenyutn的回文
05/16 01:48, 2F

05/16 01:55, , 3F
還是那句老話, 先把原理弄懂
05/16 01:55, 3F

05/16 01:57, , 4F
Here is a reference: "An introduction to the bootstrap"
05/16 01:57, 4F

05/16 01:57, , 5F
by Efron and Tibschirani
05/16 01:57, 5F

05/16 02:01, , 6F
Data"長得好看"的話500次也許太多了,長得醜的話1000次也不嫌
05/16 02:01, 6F

05/16 02:02, , 7F
多, 如果想要精確的估計confidence interval, 那麼number of
05/16 02:02, 7F

05/16 02:03, , 8F
repititions要更多
05/16 02:03, 8F

05/16 02:06, , 9F
又,我只碰過reviewer批評bootstrap repitition太少,沒碰過
05/16 02:06, 9F

05/16 02:09, , 10F
嫌太多的(笑~~), 弄懂bootstrap 你就不會說這是"操弄統計"了
05/16 02:09, 10F

11/09 15:00, , 11F
"An introdu https://muxiv.com
11/09 15:00, 11F

01/02 14:54, 7年前 , 12F
請看chenyutn的 https://daxiv.com
01/02 14:54, 12F
文章代碼(AID): #1A2znWeB (Statistics)
討論串 (同標題文章)
本文引述了以下文章的的內容:
以下文章回應了本文
完整討論串 (本文為第 7 之 10 篇):
文章代碼(AID): #1A2znWeB (Statistics)