[問題] 正則表達分割字串(已解決)
小弟我最近碰到一個問題
爬蟲爬出來的資料很亂
沒有分行符,所以會變成一個字串是"id加上資料"
比方說是
12345姆咪可愛12346測試的1號資料12347小貓旅館
我在想要怎麼把這些分開@@
變成['12345姆咪可愛','12346測試的1號資料','12347小貓旅館']這樣子
想用正則表達,可是對正則表達式不是很熟= =
目前想到[0-9]{5}([\s\S]*)
但是顯然只會找到全部...
我的id和資料間又沒有特定的符號可以讓我分割
請問各位前輩有沒有什麼方法好解決@@
補充一下,資料會含有數字和非數字,我想法是遇到下一個五位數字就切@@
但是不太知道怎麼寫
--
我的意中人是個蓋世英雄,有一天他會踩著七色的雲彩來娶我
我猜中了前頭,可是我猜不著這結局。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.104.78
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1553220548.A.CA1.html
→
03/22 10:24,
5年前
, 1F
03/22 10:24, 1F
→
03/22 10:25,
5年前
, 2F
03/22 10:25, 2F
感謝,不過我有點想要保留ID做比對用@@
目前我改成\d{5}(.*?)\d{5}
不過會變成隔行XD
還在嘗試當中
解決了,改用\d{5}(.*?)(?=\d{5})
正則表達式真的好難啊XD
推
03/22 11:07,
5年前
, 3F
03/22 11:07, 3F
剛剛測試才發現,只能最後再補上最後一段XD
※ 編輯: silverair (36.231.104.78), 03/22/2019 11:43:14
→
03/22 12:32,
5年前
, 4F
03/22 12:32, 4F
→
03/22 12:33,
5年前
, 5F
03/22 12:33, 5F
推
03/22 14:52,
5年前
, 6F
03/22 14:52, 6F
推
03/26 11:52,
5年前
, 7F
03/26 11:52, 7F
→
03/26 11:53,
5年前
, 8F
03/26 11:53, 8F
→
03/26 11:53,
5年前
, 9F
03/26 11:53, 9F
→
03/26 11:53,
5年前
, 10F
03/26 11:53, 10F
→
03/26 11:53,
5年前
, 11F
03/26 11:53, 11F
→
03/26 11:53,
5年前
, 12F
03/26 11:53, 12F
→
03/26 11:53,
5年前
, 13F
03/26 11:53, 13F
推
03/26 12:03,
5年前
, 14F
03/26 12:03, 14F
推
03/26 16:23,
5年前
, 15F
03/26 16:23, 15F
→
03/26 16:23,
5年前
, 16F
03/26 16:23, 16F
→
03/26 16:23,
5年前
, 17F
03/26 16:23, 17F
→
03/26 16:23,
5年前
, 18F
03/26 16:23, 18F
推
03/27 15:37,
5年前
, 19F
03/27 15:37, 19F
→
03/27 15:52,
5年前
, 20F
03/27 15:52, 20F