[問題] 關於資料的分級想請教大家

看板Statistics作者時間17年前 (2008/07/16 00:59), 編輯推噓8(806)
留言14則, 4人參與, 7年前最新討論串1/1
因為大學學的幾乎都忘光了,手邊雖然有本工程統計的書,但也不知該如何查起... 所以po板請教大家,希望可以獲得一些思考的方向。 因為專有名詞都不太記得,所以我盡可能地用舉例說明的方式描述, 可能有點冗長,還請見諒。 == 現有一筆資料,比如說某城市的個人資產統計: 編號 資產 ======================== 市民0001 950 市民0002 837 市民0003 850 ... 市民3348 2 市民3349 2 ... 市民4001 1 ... 市民9999 1 (萬元) 從上表可看出,其實有百分之50以上的市民,資產都只有少少的1萬元, 而且這些人的資產總合,也才佔全市個人資產的10%不到。 假設今天有一個大企業,想要在這個城市開銀行, 但因為開戶本身需要經營成本,跟資產只有一萬元的人們(雖然人數最多)做生意並 不划算(也許資產兩萬也還是不合),所以決定限制開戶者的最低持有資產。 現在問題是,有沒有一種統計的技巧/方式,或是說一種分布, 可以把這筆資料的性質描述清楚,以便我做判斷。 比如說,個人資產佔全市總資產0.01%以上的人(假設有10人),我歸類為A級客戶; 個人資產佔全市總資產0.01~0.001%的人(假設有100人),歸類為B級,依此類推; 假設我因此判斷出ABCD四級,累積資產已經達到全市資產的85%, 因此D級以下就設為不合資格戶。 我對於要如何分級,或是說每一級之間的級距該用什麼方式沒有頭緒。 感覺取標準差之類的很奇怪...也不是常態分布,總之不知道怎麼下手。 看到這裡已經非常感謝,希望能不吝指教<(_ _)> -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.134.17.76 ※ 編輯: hajimez 來自: 220.134.17.76 (07/16 01:00)

07/16 01:24, , 1F
請採用經濟學的羅倫茲曲線以及吉尼係數來試看看
07/16 01:24, 1F

07/16 01:30, , 2F
接著以行銷學的角度,你捨棄D級客戶可能會導致壞口碑
07/16 01:30, 2F

07/16 01:30, , 3F
壞口碑會導致你想要的A級客戶不來開戶
07/16 01:30, 3F

07/16 01:32, , 4F
接著不要忘記規模經濟,要知道創立新銀行
07/16 01:32, 4F

07/16 01:33, , 5F
會有很多固定成本存在,還有其他因素要考量...
07/16 01:33, 5F

07/16 01:34, , 6F
最後,會存錢的是資產多的,會借錢的是資產少的,但是不能開戶
07/16 01:34, 6F

07/16 01:34, , 7F
有可能會導致他不來借錢,那銀行就會損失消金這塊的收入
07/16 01:34, 7F

07/16 01:35, , 8F
這其中的利弊得失,在你之後的研究也可以一併討論
07/16 01:35, 8F

07/16 01:43, , 9F
我只是舉例,這不是真實的CASE,實際上只有那筆數據要處理
07/16 01:43, 9F

07/16 01:44, , 10F
還是謝謝,看來舉例不是很適當XD 明天有圖表會再放上來
07/16 01:44, 10F

07/16 07:47, , 11F
你要的只是得到一個累積百分比, 然後根據累積百分比得切割點
07/16 07:47, 11F

07/16 07:48, , 12F
如果是由隨機樣本推論群體, 就是百分位數估計的問題.
07/16 07:48, 12F

11/09 14:21, , 13F
請採用經濟學的羅倫茲曲 https://daxiv.com
11/09 14:21, 13F

01/02 14:43, 7年前 , 14F
你要的只是得到一個累積 https://daxiv.com
01/02 14:43, 14F
文章代碼(AID): #18VDT-6o (Statistics)