Re: [請問] 搜尋一般文件裡面中文字的問題
※ 引述《twoseven (Tse)》之銘言:
: 主要是想搜尋 像是ini txt ,但是格式是unicode??
: 這部分我不太懂
.ini .txt => 這是檔案格式的indicator
unicode => 這是字元集, 不是啥"格式"
: 先說說狀況
: 我有部分文件都是ini 或是txt 使用 ultraedit開啟會詢問是否轉dos格式
: 這時候中文是會正確顯示的 也可以使用中文搜尋
所謂轉格式只是改換行符號
跟中文能不能正確顯示沒有關係
跟能不能搜尋中文也沒有關係
: 但是前提必須開啟檔案,如果直接用背景搜尋 他則會找不出來
: 如使用 ue 搜尋->在檔案中尋找 這樣就找不到了
: 只能全部開啟才能多檔案搜尋 但是會跑超慢 開了約100個視窗
如果可以在不開啟檔案的情況下告訴 UE 你想搜尋的檔案的編碼
那應該就可以在背景搜尋到了
: 接著我找了一下板上介紹的 docFetcher
: 結果一樣是不行 只能找出英文
: 但是*.doc的則沒問題 可以找中文
: 問題在圖中
: http://img838.imageshack.us/i/docf.jpg/
: 麻煩各位看一下 謝謝
很明顯圖中DocFetcher誤判.txt文件編碼
當然搜不到你打的東西
而.doc編碼判斷正確故找的到
: 搜尋看了一下,大概就是需要可以支援搜尋 unicode文件的軟體 但是最好可以在背景跑
: 如ultraEdit裡面有個多檔案搜尋(他看不出是unicode 不知道是不是我不會設定)
: 但是把它全部用ue開啟在搜尋卻沒問題,相對要吃很多資源
不是"他看不出unicode"
正確的說法是(檔案關著時)UE不知道檔案的編碼
而檔案開啟後UE透過一些方法判斷該檔案編碼
(但也不一定判斷正確 故有時要使用者自行指定檔案編碼)
當編碼判斷正確時就搜尋就沒問題
: 再看了一下,應該是要UTF8的多文件搜尋軟體
: 板上之前也有人問過,似乎沒看到答案??
UTF-8是編碼 不是字元集 也不是Unicode
你應該是想找支援Unicode的多文件搜尋軟體
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.30.32
推
11/11 01:30, , 1F
11/11 01:30, 1F
推
11/11 01:38, , 2F
11/11 01:38, 2F
改成"檔案格式的indicator"了
※ 編輯: Holocaust123 來自: 140.112.30.32 (11/11 01:43)
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):