[問題] grep抓取中文字串時...
大家好, 最近在做一些文書上的處理
想使用grep把文件內的中文字串抓出來比對
可是當我使用
$ grep -w "一" filename
這樣會把 單一 周一 這種以"一"結尾的word也一併抓出...@_@"
如果使用
$ grep -w "^一" filename
會抓到 一‧零零五 這種"一"後面帶著特殊符號的word
如果用
$ grep -w "^一$" filename
就甚麼東西都找不到了 =.=
我的資料格式是
[word] 空白 [count] 空白 [prob]
所以我也試過"^一\s"
不過也是甚麼東西都抓不到...
之前是用C寫, 配合BinarySearch來找.
但感覺速度比grep還要慢=.=
請問有人有比較好的解決法嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.144.57
→
09/29 12:10, , 1F
09/29 12:10, 1F
推
09/29 12:28, , 2F
09/29 12:28, 2F
→
09/29 12:39, , 3F
09/29 12:39, 3F
→
09/29 12:46, , 4F
09/29 12:46, 4F
→
09/29 12:49, , 5F
09/29 12:49, 5F
→
09/29 12:49, , 6F
09/29 12:49, 6F
推
09/29 13:17, , 7F
09/29 13:17, 7F
→
09/29 17:02, , 8F
09/29 17:02, 8F
推
09/30 11:09, , 9F
09/30 11:09, 9F