[問題] 關於pandas讀取csv檔問題?

看板Python作者 (korman)時間7年前 (2016/11/23 13:57), 編輯推噓3(305)
留言8則, 3人參與, 最新討論串1/1
data = pd.DataFrame(pd.read_csv('h:\\test\\test.csv',header=0)) 錯誤顯示為:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0: invalid start byte 原始csv檔內容 買賣 數量 貨品 10 1 TV 我發現如果CSV檔內容如果有中文就會報錯,應該是編碼問題 不知道有沒有跟我遇到一樣的問題 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.8.48.200 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1479880647.A.47D.html

11/23 16:10, , 1F
我自己的非標準解法,用記事本打開CSV另存新檔編碼改UTF
11/23 16:10, 1F

11/23 16:11, , 2F
有試過其他方法,但是資料存放讀取一兩次以後編碼還是會有
11/23 16:11, 2F

11/23 16:11, , 3F
問題... 所以才出此下策... 同求高手解法
11/23 16:11, 3F

11/24 08:38, , 4F
你看一下你開存檔的模組有沒有能輸入編碼的參數
11/24 08:38, 4F

11/24 08:39, , 5F
"資料存放讀取一兩次" 代表你讀寫過程中又寫入非 unicode
11/24 08:39, 5F

11/24 15:58, , 6F
謝s大指教~ 我再去檢查一下哪段搞砸了~
11/24 15:58, 6F

01/03 12:47, , 7F
補上 encoding="ISO-8859-1"
01/03 12:47, 7F

01/03 13:29, , 8F
更正 是這個才對encoding = "big5"
01/03 13:29, 8F
文章代碼(AID): #1ODI_7Hz (Python)