[SQL ] Access上作去除重複資料(de-dupe)問題
各位前輩好,目前我在嘗試作大量資料dedupe,以access 2003實作。
檔案格式如下:
file 1
name address
-----------------------------
Abc Xyz 123 blk xy road
file 2
name address
-----------------------------
Xyz Abc 123 blk xy rd.
問題有3:
1. dedupe name時,有前後順序的問題。我有想過將name作切割作比對,但不知道是否有
更好的作法
2. dedupe add時,會有縮寫的問題。目前也是想到以字串函數抓縮寫作比對。同樣的,不
曉得是否有更好的作法..
3. 目前是要用SQL+VBA寫,不知道各位大大在coding上有什麼建議..
問題可能蠻接近是data clean的問題,若有任何的資源可以提供,感激不盡!
這是小弟嘗試寫的第一個資料庫,問題若問的不好,還請見諒。感恩!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 58.185.35.134
※ 編輯: geo317 來自: 58.185.35.134 (03/15 22:36)
推
03/16 00:48, , 1F
03/16 00:48, 1F