[問題] 想請教關於SPELL CHECKER
我現在在寫一個有點關於SPELL CHECKER的程式
主要是把一個LIST裡面的單字分類並且指出可能的錯誤
假設List 裡面有 apple, aple, spple, book, booook, chapter 6個單字
我想要把apple, aple跟spple放在同一類
並且指出aple跟spple可能是typo
因為aple跟spple的edit distance跟apple差異為一
如果我是把list 按照第一個字母分類的話
spple 就會自己為一類,極有可能不會被發現跟apple的edit distance為一
有什麼方法可以發現spple呢?
難不成要一個一個compare嘛? 因為list有可能很長
一個一個compare會很沒有效率 所以想問問大家有沒有好方法?
如果不行的話 只好回歸沒效率方法了
soundex無法解決
但是book跟booook可以用soundex跟它的改良法來找出問題
第一個字母的問題目前還沒想到怎麼解決
拜託大家提供一點idea吧
thanks
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.238.10.98
→
04/10 05:09, , 1F
04/10 05:09, 1F
※ tui:轉錄至看板 java 04/10 05:11