Re: [問題] 資料分析
: 我的問題是這樣的:
: 我的樣本資料是材料裡的結構組織,其中每個組織都是由許多晶體所組成。
: 在我的分析下會得到三度空間裡的三個角度值(x,y,z),也就是晶體內部的擺向座標軸透
: 過沿X軸轉動x角度,沿Y軸轉動y角度,沿Z軸轉動z角度,而把晶體內部的座標軸與外部
: 的座標軸重合。
: 然而在同樣的組織中,應該會有同樣的晶體擺向,也就是說會有同樣的(x,y,z),但是在
: 我的觀察中發現有許多值有些微偏離(x,y,z),偏離的角度不一而得到許多(x1,y1,z1),
: 但在分析的角度上會把此當成雜訊。
: 所以我希望能夠透過統計的方式把一萬五千筆數據經過有效的處理後找出佔大多數(x,y,z)
: 三個角度值,並且找出它佔的比例。
: 由於自己並非是統計相關領域的專才,之前所學也太過於淺薄,故希望能透過板上的能人
: 們的幫忙解決此問題。
: 感謝看完,下台一鞠躬。OTZ...
這樣就清楚多了
果然我從開始就totally搞錯你的問題orz
回到正題
我目前有兩個想法
1.如果有理由相信一萬五千筆數據中的大部分(這個大部分是相對多而不是絕對多)都可以
命中靶心(x,y,z)的話,那就對樣本作frequency table然後找出dense最高的點出來就
行了,佔的比例就看frequency是多少也就知道了,這件事情很多套裝軟體都可以做到,
excel應該就可以了,不過這看起來不像是統計的問題XD
2.第二種可能比較像是統計問題,就是這一萬五千個點都是在(x,y,z)附近擾動,可能剛
好命中靶心,也可能沒有命中,而且沒有理由相信會有很多值完全命中靶心。只是這樣
的情況下要找那個比例就有一點不知所云了。
如果是這種狀況,我們大概可以假設一個model是
observed value = real value + noise
其中 real value是一個未知定數,observed value是我們的觀察值,noise是雜訊
然後我們可能需要對noise作一些假設,例如symmetric, equal variance, 或是分配上
的假設。然後去作分析,再來驗證noise的假設合不合理,and so on
不過如果真的是2這種情形的話,這個問題就會變得有點大有點複雜了,他大概也沒有
一個標準的作法說第一步應該怎麼作第二步應該怎麼作,常常是case by case的,靠版
上這樣的訊息傳遞大概不會是一個好方法,建議還是尋求指導老師或是同學的直接協助
會比較有用一點。
以上是我的一點想法,供您參考:)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.40.59
推
10/28 23:16, , 1F
10/28 23:16, 1F
討論串 (同標題文章)