[問題] 字串段落尋找

看板Linux作者 ( )時間10年前 (2014/04/10 11:35), 編輯推噓1(107)
留言8則, 5人參與, 最新討論串1/1
請問版友 要怎麼取得Html文字中的某個區段內容 例如內容如下 <head> <li><a href="#01">XXXXXX</a></li> <li><a href="#02">YYYYYY</a></li> </head> <head> <li><a href="#01">MMMMMM</a></li> <li><a href="#02">NNNNNN</a></li> </head> 要怎麼取得第二組head內中的資料,例如取得 <li><a href="#01">MMMMMM</a></li> <li><a href="#02">NNNNNN</a></li> 目前的處理方式是用grep "MMMMMM" 跟grep "NNNNNN" 但是因為MMMMM跟NNNNN會變動,所以不好處理 想請問有沒有方式可以用<head>跟</head>當成標記 來處理字串的方式呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.173.167.3 ※ 文章網址: http://www.ptt.cc/bbs/Linux/M.1397100944.A.FD4.html

04/10 12:03, , 1F
grep href=\"#0 filename
04/10 12:03, 1F

04/10 12:08, , 2F
grep href=\"#0[12] filename
04/10 12:08, 2F

04/10 12:15, , 3F
sed -n '3,4p'
04/10 12:15, 3F

04/10 16:21, , 4F
看看 grep -C 3 "MMMMMM" 能不能符合你的需求
04/10 16:21, 4F

04/10 21:55, , 5F
cat test.html | sed '1,/<\/head>/d'
04/10 21:55, 5F

04/10 21:55, , 6F
(承上) | sed -e '/^.*<head>/ d' -e '/<\/head>.*$/ d'
04/10 21:55, 6F

04/10 23:49, , 7F
Awk 設定字首字尾
04/10 23:49, 7F

04/14 11:13, , 8F
謝謝 版友們 ^_^
04/14 11:13, 8F
文章代碼(AID): #1JHX6G_K (Linux)