: 我有兩個文字檔,大約有40萬行
: 這兩個文字檔重複性很高,
: 例如:
: 文件A 的第一行 , 可能出現在文件B第1000行
: 文件A 的第20行 , 可能出現在文件B第10000行
:
: 我希望比對這兩份文件 各缺什麼資料
:
: → hpo14: https://askubuntu.com/questions/845502 11/14 01:08
: → hpo14: grep -Fvxf file2 file1 11/14 01:08
linux 內建 grep 指令 / windows 的話請自己去下載 grep
ex: http://unxutils.sourceforge.net/
grep -Fvxf file2 file1 > file1_extra
~~~~~ file1 有,但 file2 沒有 的內容
grep -Fvxf file1 file2 > file2_extra
~~~~~ file1 沒有,但 file2 有 的內容
參數說明: grep [-參數] PATTERN FILE
搜尋對象
搜尋內容
-F PATTERN 是以"斷行"分隔的內容
-f 從檔案取得 PATTERN
-v 選出沒找到的內容
-x PATTERN 必須完全符合
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.17.25
※ 文章網址: https://www.ptt.cc/bbs/EZsoft/M.1542130273.A.EDD.html
推
11/14 06:54,
5年前
, 1F
11/14 06:54, 1F
推
11/15 22:27,
5年前
, 2F
11/15 22:27, 2F
→
11/15 22:28,
5年前
, 3F
11/15 22:28, 3F
→
11/15 23:35,
5年前
, 4F
11/15 23:35, 4F
推
11/16 21:36,
5年前
, 5F
11/16 21:36, 5F
→
11/17 10:30,
5年前
, 6F
11/17 10:30, 6F
→
11/18 14:50,
5年前
, 7F
11/18 14:50, 7F
推
11/22 07:05,
5年前
, 8F
11/22 07:05, 8F
推
12/03 22:49,
5年前
, 9F
12/03 22:49, 9F
討論串 (同標題文章)