[問題] 關於資料的分級想請教大家
因為大學學的幾乎都忘光了,手邊雖然有本工程統計的書,但也不知該如何查起...
所以po板請教大家,希望可以獲得一些思考的方向。
因為專有名詞都不太記得,所以我盡可能地用舉例說明的方式描述,
可能有點冗長,還請見諒。
==
現有一筆資料,比如說某城市的個人資產統計:
編號 資產
========================
市民0001 950
市民0002 837
市民0003 850
...
市民3348 2
市民3349 2
...
市民4001 1
...
市民9999 1 (萬元)
從上表可看出,其實有百分之50以上的市民,資產都只有少少的1萬元,
而且這些人的資產總合,也才佔全市個人資產的10%不到。
假設今天有一個大企業,想要在這個城市開銀行,
但因為開戶本身需要經營成本,跟資產只有一萬元的人們(雖然人數最多)做生意並
不划算(也許資產兩萬也還是不合),所以決定限制開戶者的最低持有資產。
現在問題是,有沒有一種統計的技巧/方式,或是說一種分布,
可以把這筆資料的性質描述清楚,以便我做判斷。
比如說,個人資產佔全市總資產0.01%以上的人(假設有10人),我歸類為A級客戶;
個人資產佔全市總資產0.01~0.001%的人(假設有100人),歸類為B級,依此類推;
假設我因此判斷出ABCD四級,累積資產已經達到全市資產的85%,
因此D級以下就設為不合資格戶。
我對於要如何分級,或是說每一級之間的級距該用什麼方式沒有頭緒。
感覺取標準差之類的很奇怪...也不是常態分布,總之不知道怎麼下手。
看到這裡已經非常感謝,希望能不吝指教<(_ _)>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.134.17.76
※ 編輯: hajimez 來自: 220.134.17.76 (07/16 01:00)
推
07/16 01:24, , 1F
07/16 01:24, 1F
推
07/16 01:30, , 2F
07/16 01:30, 2F
推
07/16 01:30, , 3F
07/16 01:30, 3F
推
07/16 01:32, , 4F
07/16 01:32, 4F
推
07/16 01:33, , 5F
07/16 01:33, 5F
推
07/16 01:34, , 6F
07/16 01:34, 6F
推
07/16 01:34, , 7F
07/16 01:34, 7F
推
07/16 01:35, , 8F
07/16 01:35, 8F
→
07/16 01:43, , 9F
07/16 01:43, 9F
→
07/16 01:44, , 10F
07/16 01:44, 10F
→
07/16 07:47, , 11F
07/16 07:47, 11F
→
07/16 07:48, , 12F
07/16 07:48, 12F
→
11/09 14:21, , 13F
11/09 14:21, 13F
→
01/02 14:43,
7年前
, 14F
01/02 14:43, 14F