[問題] parse unicude

看板Perl作者 (corn)時間15年前 (2009/03/29 00:02), 編輯推噓2(202)
留言4則, 3人參與, 最新討論串1/1
請問有辦法 parse 網頁一段中文unicode 「 \u6c92\u770b\u5230\u6c92\u770b\u5230>//< 」 類似這樣 有什麼模組可以用嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.94.82

03/29 22:30, , 1F
$str =~ s/\\u([0-9a-zA-Z]{4})/chr hex $1/ge;
03/29 22:30, 1F

04/01 03:42, , 2F
$str =~ s/\\u([[:xdigit:]]{4})/pack("U", hex($1))/ge;
04/01 03:42, 2F

04/01 03:43, , 3F
chr根據use的pragma不同會有不同的結果...
04/01 03:43, 3F

04/21 12:41, , 4F
可參考 perldoc perlunicode 有提供多種 charset 字符集
04/21 12:41, 4F
文章代碼(AID): #19padwf6 (Perl)