Re: [問題] 從網站裡抓日文字串然後存起來
因為日本網站很多都是用jis或shift jis
知道哪個網站的話先去看一下charset,比方說
2ch.net -> Right Mouse Click -> view source
...
<meta http-equiv="Content-Type" content="text/html; charset=shift_jis" />
...
然後把你的InputStreamReader編碼改成
URL url = new URL(urltext);
BufferedReader in = new BufferedReader(new
InputStreamReader(url.openStream(), "Shift_JIS"));
這裡有日文的網頁講的比較詳細:
http://ash.jp/java/stream.htm
※ 引述《ficecmiraror (秘密ID)》之銘言:
: 我想寫一個程式可以從日本網站裡抓字串然後存起來~
: 但是在編碼那裡一直遇到問題@@~
: 一開始我是用
: URL url = new URL(urltext);
: BufferedReader in = new BufferedReader(new
: InputStreamReader(url.openStream()));
: 來抓~
: 但我發現存起來的字串都是亂碼~
: 後來我想說用string來標訂位移~
: 再用byte來read~read到目地時就存起來~
: 沒想到日文字一個好像是3bytes?(似乎是shift_jis or JIS編碼)
: 有人可以教一下要怎麼存嗎QQ~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 199.255.80.20
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):