Re: [問題] 讀取XML檔

看板R_Language作者 (Alan)時間6年前 (2018/05/24 10:08), 6年前編輯推噓1(102)
留言3則, 3人參與, 6年前最新討論串2/2 (看更多)
※ 引述《alanfengjkl (Alan)》之銘言: : [問題類型]: : 程式諮詢 : [軟體熟悉度]: : 使用者 : [問題敘述]: : 在使用R讀取XML檔案時 : 出現下列ERROR : 想知道如何排除問題? : 另外由於資料是BIG5 : 讀進來後若有亂碼該如何處理? : [程式範例]: : library(XML) : xml.doc <- xmlParse(file,encoding = "BIG5") : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : xmlParseEntityRef: no name : input conversion failed due to input error, bytes 0xF9 0xDC 0xBC 0x7A : input conversion failed due to input error, bytes 0xF9 0xDC 0xBC 0x7A : encoder errorPremature end of data in tag ?冽饿??line 168391 : Premature end of data in tag 撣喳腙?怿敦 line 168384 : Premature end of data in tag INVOICE line 2 : Error: 1: xmlParseEntityRef: no name : 2: xmlParseEntityRef: no name : 3: xmlParseEntityRef: no name : 4: xmlParseEntityRef: no name : 5: xmlParseEntityRef: no name : 6: xmlParseEntityRef: no name : 7: xmlParseEntityRef: no name : 8: xmlParseEntityRef: no name : 9: xmlParseEntityRef: no name : 10: xmlParseEntityRef: no name : 11: input conversion failed due to input error, bytes 0xF9 0xDC 0xBC 0x7A : 12: input conversion failed due to input error, bytes 0xF9 0xDC 0xBC 0x7A : 13: encoder error14: Premature end of data in tag ?冽饿??line 168391 : 15: Premature end of data in tag 撣喳腙?怿敦 line 168384 : 16: Premature end of data in tag INVOICE line 2 : [環境敘述]: : 最新版R : 可是我用xml2也有error如下 > rm(list=ls()) > file="C0001BILL9_EBill_20180505_20180505114335.xml" > setwd("D:/") > library(xml2) > d=read_xml(file,encoding="BIG5") Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) : xmlParseEntityRef: no name [68] > d=read_html(file,encoding="BIG5") Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) : input conversion failed due to input error, bytes 0xF9 0xDC 0xBC 0x7A [600 3] -- posted from bbs reader hybrid on my samsung SM-G965F -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.50.148.91 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1527127732.A.CCC.html

05/24 11:33, 6年前 , 1F
可是你沒有給讓網友能重現錯誤的方式,所以我也幫不了
05/24 11:33, 1F

05/25 08:55, 6年前 , 2F
先把Windows換掉,大概就解決了
05/25 08:55, 2F

05/31 05:57, 6年前 , 3F
encoding="UTF-8"
05/31 05:57, 3F
我的XML內碼是BIG5,不是UTF-8,我後來用暴力破解法,直接用readLines讀入文字,自己寫迴圈解析 ※ 編輯: alanfengjkl (220.130.135.230), 05/31/2018 08:22:15
文章代碼(AID): #1R1XwqpC (R_Language)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
文章代碼(AID): #1R1XwqpC (R_Language)