[問題] pandas 讀取csv問題

看板Python作者 (鹹鹹)時間6年前 (2018/04/07 22:16), 編輯推噓6(6018)
留言24則, 5人參與, 6年前最新討論串1/1
小弟是初學python的新手 網路上有各式各樣讀取CSV的方式好幾種都試過了好像都沒辦法成功 想請問一下一些關於讀取csv檔的問題 我的csv檔資料大約長這樣 label,feature 1 ,70 80 82 72 58 ......... 0 ,80 50 45 125 45 ....... 2 ,120 40 56 78 45 ....... . . 前面是label,後面是pixel(48*48) 目前是用pandas讀取資料的方式 df = pd.read_csv('train.csv') 此時print(train.shape) 為(20000,2) <-20000筆資料 我想問的是如何將後面pixel的資料分開變成48*48的array 因為我如果直接將feature用as_matrix的方式變成narray 他會直接變成28000*1的vector然後每一列都是[70 80 82 72 58....]這種形式 想問怎麼把它變成[70,80,82,72.....]這樣子的形式不然我不能reshape成48*48 這問題困擾我一段時間了故上來發問 加上我打的關鍵字出來的東西好像都.. 麻煩各位大大解惑了 另外再問一個白癡問題,如果用excel開csv檔都沒有逗號是正常的嗎?用程式這邊看會有 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.249.177.201 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1523110584.A.5DC.html

04/07 22:22, 6年前 , 1F
pd.read_csv(..., sep=' ', ...)
04/07 22:22, 1F

04/07 22:35, 6年前 , 2F
gold大,我有試過這個了這樣子df的shape會變成(20000
04/07 22:35, 2F

04/07 22:35, 6年前 , 3F
,1)耶
04/07 22:35, 3F

04/07 23:27, 6年前 , 4F
那可能是用tab分的吧 sep='\t' 看看
04/07 23:27, 4F

04/07 23:28, 6年前 , 5F
還不行你就傳個前幾行的版本上來看看
04/07 23:28, 5F

04/07 23:38, 6年前 , 6F
試試看這個方法dataset = pd.read_csv('train.csv')
04/07 23:38, 6F

04/07 23:38, 6年前 , 7F
xdata = dataset['feature']
04/07 23:38, 7F

04/07 23:38, 6年前 , 8F
xdata = pd.DataFrame(xdata.str.split(' ').tolist())
04/07 23:38, 8F

04/07 23:40, 6年前 , 9F
xdata = xdata.reshape(-1,48,48)
04/07 23:40, 9F

04/07 23:59, 6年前 , 10F
gold大還是不行 你是只程式前幾行嗎
04/07 23:59, 10F

04/08 00:01, 6年前 , 11F
'StringMethods' object has no attribute 'spilt'
04/08 00:01, 11F

04/08 00:01, 6年前 , 12F
我正在找原因
04/08 00:01, 12F

04/08 00:18, 6年前 , 13F
h大用你的方法會xdata.shape會變成(20000,2304)!
04/08 00:18, 13F

04/08 00:19, 6年前 , 14F
但是會出現df沒有reshape的功能,於是我加了一行
04/08 00:19, 14F

04/08 00:25, 6年前 , 15F
xdata=xdata.as_matrix()就可以了! 看起來是成功了
04/08 00:25, 15F

04/08 00:25, 6年前 , 16F
非常謝謝我估狗了很久都沒有解決QQ
04/08 00:25, 16F

04/08 12:01, 6年前 , 17F
同學你修ML的嗎XD
04/08 12:01, 17F

04/08 12:02, 6年前 , 18F
xdata.map(lambda x: x.split(‘ ‘))
04/08 12:02, 18F

04/08 12:08, 6年前 , 19F

04/08 12:09, 6年前 , 20F
直接貼好了 懶得打
04/08 12:09, 20F

04/08 12:10, 6年前 , 21F
關鍵是要tolist再重新建ndarray
04/08 12:10, 21F

04/08 17:58, 6年前 , 22F
sean大謝謝我現在人在外面回去用你的方式試試看!!我
04/08 17:58, 22F

04/08 17:58, 6年前 , 23F
是ML初學者在練習題目><
04/08 17:58, 23F

04/09 06:09, 6年前 , 24F
嘻嘻樓主該不會跟我修同堂課吧XDD
04/09 06:09, 24F
文章代碼(AID): #1QoDAuNS (Python)