Re: [問題] 有關文字文件編碼判斷
※ 引述《oracledb (oo)》之銘言:
: 我最近在做一個關於文字檔(*.doc, *.txt..etc.)
: 的編碼判斷程式,然後我在網路上找到一個package -- jchardet,
: 按照上面寫的範例套進去使用,
: 在文件打開,讀取一部份的位元陣列byte[],
: 然後丟進這個package某個method,
: 可是我測試之後發現這個套件的編碼判斷不是很準確,
: 好像只有ascii的編碼會正確判斷出來,
: 其他包括UTF-8, unicode都會判斷失敗,
: 然後列出一長串"可能的編碼"。
: 在這個部分,請問有沒有人曾經做過類似的事,
: 有沒有比較好的解法?
沒有準確的辨法, 不用問了.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.229.165.118
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):