Re: [問題] 關於Z score
※ 引述《IamPUMA (我是普馬)》之銘言:
: : 不好意思,有個很怪的問題想請問大家
: : 標準化是將樣本值減去均數後,再除標準差
: : 而這樣得到的結果稱為Z-score或standard score
: : 我的問題是
: 你的問題不是這個吧~~~????
: _
: X - mean
: 還是 所謂 Z = ________________
: sigma
您這裡提到的我想應該是分配收斂到Normal
而我只是很單純的計算標準化之後的值
我們講的應該是不一樣的東西吧
如果有錯麻煩指正
: : 1.這是否需建立在母體為常態的假設上?
: : 2.若母體非常態,標準化後的值是否仍有對應的名詞?
: : 雖然這樣算出來的值沒辦法對應到z-table
: : 不過仍然可視為一個衡量相對位置的值吧
: : (還是可以表示該樣本距離均數幾個標準差)
: : 3.若不存在母體,將作何解釋?
: : 例如我要將班上10個同學的考試成績標準化
: : 但不一定代表背後有一個成績的母體對吧?
: : 若沒有母體則同學的成績也就不能說是抽樣的結果了
: : 那麼這樣標準化是否還有意義,是否還有對應的名詞?
: 不存在母體...那你是要推論什麼 ?
: 你那10個同學就是母體啊 !!!!!!!!!!!! 你這叫做普查 Census
: 你沒有搞清楚你要幹什麼哦 ~! 為什麼要標準化 ??
: 盲目的操作會出問題的唷
很抱歉,我也覺得我思緒有點混亂,竟然會有沒有母體這種想法
重新想過之後,我再試著把問題表示清楚一點
現有甲、乙兩班學生分別用A、B兩份考卷進行測驗
考完試後要將甲、乙兩班混合排名
但因為考卷不同,難易度不同,直接用原始分數排名不夠公平
所以產生將兩班成績各自標準化後再比較的想法
問題是我不知道該怎麼定義什麼是母體、什麼是樣本,隨機變數又是哪個?
想法1:
甲、乙兩班各為一個母體,分數是隨機變數
每一個同學的分數是一個抽樣結果
也就是X是代表甲班的分數隨機變數
若甲班有10位同學,他們的成績分別是X1...X10的抽樣結果
這個情況下無論母體是何種分配,標準化之後都是一個可比較的值
但如果A、B兩份考券恰巧難易度相同,而且甲班程度本來就比較好
這樣卻可能讓乙班本來成績比甲班差的,標準化後得到比甲班更好的Z值
(如 甲1 > 乙2,Z乙2 > Z甲1 可能會發生這個標準化後反而之真的例子)
想法2:
把這兩個母體用隨機變數表示也許是錯誤的想法
如果是所謂的「普查」,那麼標準化這個過程是否還有意義?
或者,兩班的分數根本就沒辦法比較呢?
有什麼方法可解決這個問題呢?
麻煩大家了,真是不好意思
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.204.50.253
※ 編輯: squall500 來自: 123.204.50.253 (10/29 23:57)
推
10/30 10:56, , 1F
10/30 10:56, 1F
→
10/31 08:35, , 2F
10/31 08:35, 2F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 4 篇):