[問題] 樣本"出現機率"的標準差

看板Statistics作者 ( hopeless)時間13年前 (2012/08/14 01:03), 編輯推噓1(104)
留言5則, 2人參與, 最新討論串1/1
不好意思,連續好幾天碰到太多數據眼花撩亂無法思考 向各位大大問兩題很基本的問題,第一個回答我的大大附上500P(含稅)聊表謝意 1.假設從一個班級裡抽出5個人的身高來做統計,那麼計算標準差時應該是要用樣本標準 差 也就是n-1對嗎?? 2. 姓名 身高 甲 160 乙 160 丙 155 丁 150 戊 140 這是身高資料,我現在想要知道"每一種身高的出現機率的均數和標準差" 也就是 身高 出現次數 出現機率 160 2 40% 155 1 20% 150 1 20% 140 1 20% 那請問出現機率的平均數是 100%/4=25% 還是 (40%*2+20%*1+20%*1+20%*1)/5=28%?? 我困惑點在"160的出現機率是40%,但它出現2次",那計算標準差的時候 是要2*(40%-25%)^2呢,還是不用管出現次數? 我原本的想法是"出現機率"已經考慮到出現次數了,所以計算出現機率的標準差時, 就不用再去管樣本在群體中的出現次數,不知道這樣對不對? 謝謝m_ _m -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.169.212.63

08/14 02:40, , 1F
這五個人比較像樣本 另外你為何要算"出現機率"的標準差
08/14 02:40, 1F

08/14 02:48, , 2F
這是我簡化後的題目 原本是從母體找出樣式(pattern)種類
08/14 02:48, 2F

08/14 02:49, , 3F
再計算每個樣式的出現機率(即支持度) 標準差可以幫助訂定
08/14 02:49, 3F

08/14 02:49, , 4F
最小支持度 這樣我才知道有那些樣式是有意義的
08/14 02:49, 4F

08/14 02:50, , 5F
原本的樣式是user的網頁瀏覽模式
08/14 02:50, 5F
文章代碼(AID): #1GAJD5wk (Statistics)