[問題]關於大量資料各種不同條件規範之個數統計
在此想請教版上各位高手
目前我手上有一堆.csv檔案的row data (大約有5000個左右的.csv檔)
其主要檔案內容如下
ex:
1,a1,b1,c1,d1,e1,............,x1,y1
2,a2,b2,c2,d2,e2,............,x2,y2
3,a3,b3,c3,d3,e3,............,x3,y3
.
.
.
20000,a20000,b20000,c20000,d20000,e20000,............,x20000,y20000
其中a1~a20000、b1~b20000、c1~c20000、d1~d20000..... 皆為數值
a、b、c、d...代表某個樣品其個別對應特性
每個.csv檔大約都有19000~21000筆樣品的row data
在此想請問若我想建立以下格式
條件1:b>10
條件2:c>250
規範:
┌────┬─────┬─────┐
│ │0.1<y≦0.2│0.1<y≦0.2│
├────┼─────┼─────┤
│0<x≦5 │ Grade1 │ Grade2 │
├────┼─────┼─────┤
│5<x≦10 │ Grade3 │ Grade4 │
├────┼─────┼─────┤
│10<x≦15│ Grade5 │ Grade6 │
├────┼─────┼─────┤
│15<x≦20│ Grade7 │ Grade8 │
└────┴─────┴─────┘
以上的意思是在b特性值大於10與c特性值大於250時候
x特性值大於0且小於等於5 與 y特性值大於0.1且小於等於0.2時候
Grade1欄由初始值0累計為1 其他Grade欄同理
主要是要得到所有樣品其不同特性下之分布
目前我主要卡在如何讀取n檔內第n行開始的row data
與如何將累積的數量輸出成一個新的檔案表格(ex:csv檔或者txt檔)
煩請各位高手幫忙解答了 感恩 @@
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.123.133.217