[問題] 簡單數據分群

看板Statistics作者 (Nikonian)時間14年前 (2010/03/09 17:18), 編輯推噓1(1011)
留言12則, 5人參與, 5年前最新討論串1/2 (看更多)
是這樣的,我家在設計一項產品,而這像產品的尺寸是跟身高有關的 目前想分成五個尺寸,從100cm到200cm,然而雖然身高是接近常態分佈 感覺好像就每20公分的身高作一個尺寸就好 但是問題是這樣分尺寸的話,就會有不少人會很難挑到合適的尺寸 例如身高160cm的人,剛好卡在140-160和160-180之間 所以如果有大概一千筆身高資料的情況下 有沒有什麼比較好的分群方法以及軟體能夠作這件事情? 因為如果把小孩的狀況考慮進去,就會變成其實在120-140cm那段成長很快 所以在資料裡面並不是真的常態,而是接近雙峰的分佈 所以希望可以透過真正的身高資料去作分群 最好做完分群之後,每一組都有顯著差異,然後可以求得平均值 不知道我的描述大家理解嗎?好像是不太難的任務 但是我不太懂統計,就很難,所以要請各位幫忙了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 58.115.16.69

03/09 17:25, , 1F
用R軟體 , kmeans() 函式 , k=5
03/09 17:25, 1F

03/09 17:27, , 2F
google 關鍵字 "supervised" "cluster" "classification"
03/09 17:27, 2F

03/09 18:37, , 3F
Thanks! 我試試看!
03/09 18:37, 3F

03/09 23:29, , 4F
很有趣的問題!
03/09 23:29, 4F

03/10 01:18, , 5F
要避免跨組的困惑, 切割點可取 "不可能出現" 的數字.
03/10 01:18, 5F

03/10 01:19, , 6F
然而, 若就 "實際問題" 而言, 那只是自欺欺人罷了!
03/10 01:19, 6F

03/10 01:20, , 7F
如所舉身高, 若分割點是 160.1 或 160.5 而量測值只取到整數
03/10 01:20, 7F

03/10 01:21, , 8F
固可免除 160 該適用哪一組的問題. 然而, 160身高套用140.5-
03/10 01:21, 8F

03/10 01:22, , 9F
160.5的成品, 與套用140-160成品, 有真正差別嗎?
03/10 01:22, 9F

03/10 01:27, , 10F
或許更應考慮的, 是組距是否會太大, 使得落入同一組者僅有少
03/10 01:27, 10F

03/10 01:28, , 11F
數數值(身高)接近組中點者真正能適用該組規格之產品.
03/10 01:28, 11F

01/02 15:04, 5年前 , 12F
然而, 若就 "實際問 https://muxiv.com
01/02 15:04, 12F
文章代碼(AID): #1BbX9YiH (Statistics)
文章代碼(AID): #1BbX9YiH (Statistics)