[問題] 包含換行符的文字處理
我想把某 html 的 javascript 都切掉,
用 perl 寫就是 ` $html =~ s#<script(.|\n)*?</script>##g ; `
我想知道有沒有單行的寫法。
`perl -pe` 會變成逐行處理,
而 sed 和 awk 又只有處理單行內的比較方便。
sed 還沒有貪婪模式……。
我用的方法:
$ tr '\n' '\0' < foo.html | perl -pe '...' | tr '\0' '\n'
--
因為她不知道,唯一值得她流淚的人,絕不會讓她流淚。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.102.204
※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1456751085.A.0DA.html
→
02/29 21:53, , 1F
02/29 21:53, 1F
→
03/01 17:35, , 2F
03/01 17:35, 2F
→
03/01 17:35, , 3F
03/01 17:35, 3F
→
03/02 20:41, , 4F
03/02 20:41, 4F
→
03/02 20:44, , 5F
03/02 20:44, 5F
→
03/02 23:08, , 6F
03/02 23:08, 6F
→
03/03 00:59, , 7F
03/03 00:59, 7F