[問題] 請教編碼問題
目前寫了隻程式
主要內容是擷取網頁原始碼並過濾網頁標籤
最後輸出成BIG5編碼的文字檔
目前碰到一個問題,擷取的網頁是UTF8的香港網頁
轉成BIG5後有些字會變成問號
例如 "恒"生 這些香港特有的繁體字
用UTF8跟BIG5_HKSCS編碼都不會有漏字的問題
但是偏偏一定要轉成BIG5輸出 Orz
不知板上的高手有沒有什麼建議
可以轉成BIG5後的內容不要漏字
先謝過各位了
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 58.114.194.163
推
10/22 22:06, , 1F
10/22 22:06, 1F
→
10/22 23:10, , 2F
10/22 23:10, 2F
推
10/22 23:12, , 3F
10/22 23:12, 3F
→
10/23 11:52, , 4F
10/23 11:52, 4F
→
10/23 11:54, , 5F
10/23 11:54, 5F
→
10/23 15:57, , 6F
10/23 15:57, 6F
→
10/23 15:59, , 7F
10/23 15:59, 7F
→
10/23 16:01, , 8F
10/23 16:01, 8F