[轉錄] 一篇關於"重碼字的問題"的文章

看板Array作者 ( )時間13年前 (2011/03/30 04:15), 編輯推噓3(3011)
留言14則, 3人參與, 最新討論串1/1
近日在網路上閒逛,發現了行列發明人廖明德先生在網路上發表了一篇關於"重碼字問 題"文章。相信可以讓許多人更了解,如何訂定"重碼字順序"以及"簡碼與特別碼編排"的原 則。以下為轉錄內容,希望對大家有所幫助。 =============================================================================== 問:為何「減」這字既無特碼,亦無簡碼呢?此字的使用頻率也不低的說! 答:特別碼的安排有其考慮因素,除了要有適合的空位、字頻高優先外,也要考慮記憶的 難度,太難記憶硬安排的結果是沒人使用。 以"減"字而言,在13053字裡字頻排序為864,算是使用率不低,但以它的字根碼想安排在 首首(38 38)有"沝"字,首二(38 19)有"尖"字,首三(38 10)有"江"字,首尾(38 26)有" 渢"字,二三有"左"字, 二尾有"戊"字,三三有"比"字,三尾有"長"字,尾尾有"絲"字, 所以幾乎是沒有可助記的空位放特別碼。現在字集加大,要安排特別碼更沒有空間了。 再說一級簡碼,"減"的第一個字根鍵位是[3v],但這個位置的一級簡碼的十個字,每個都 比"減"字頻高,所以一級簡碼輪不到它。 而二級簡碼因為有很多字不可能記憶,所以只能依規則(第二個字根碼的第一個數字)來擺 放,而"減"字的第二個字根碼(19)的第一個數字是1,只能擺第1個位置,但那位置已被兩 根的本字"尖"字占了。所以它也沒能被擺進二級簡碼。 問:又「嚐、寵、慣……等等」這些字使用率不低,卻排在重碼字的次選項(首選字通常 都有簡特碼可用)。 答:重碼字應以正常輸入的情況來考慮,因大多數行列使用者是以正常編碼來輸入,這樣 就夠用了,他們並不想去記特別碼,簡碼也是用久了自然記住的才使用,一級簡碼還可以 ,要記二級簡碼就比較難了。反而要記住重碼字是第幾個還比較容易。 上列這些重碼字的使用頻率在倚天時代編碼時就有依據教育部的字頻資料排序設計,昨天 我特地比對新的字頻資料(中研院的平衡語料庫+網路論壇字頻,其實也不夠新),1龐2寵 及 1實2慣的排序仍是正確的,而"嚐"字字頻有比"噹"強一些,但差距不大,而「噹、龐 、實」這三個被排在前面的重碼字也都有被收進二級簡碼。雖然「重碼次選字挪至首選項 」我認為並不適合,但你說的也有另一種道理,也許可考慮把第二重碼字「嚐、寵、慣」 放進二級簡碼。當時只想到要把字頻最高的放進簡碼。 談到重碼字也要提到歷史:在倚天時代因當時電腦記憶體非常珍貴,當時對照表必需儘量 壓縮,只能用內碼排序,這樣才可以不記內碼,行列每次敲鍵都可能是30個鍵其中的一個 ,而每個字最多會有4鍵,又要把一二級簡碼的資訊也記進去,這樣每個字只能用3個 byte來記錄, Big5的13053字集行列對照表總共只有39K,當它被載入記憶體仍保持壓縮 格式,程式是將每個敲進來的鍵先壓縮成5個bit再去和對照表進行bit比對,當時對照表 不可能用字頻排序,只能在對照表的檔頭針對必需調整的96個重碼字作記錄,每當出現重 碼字就拿這96個字來比對,如果該字有被包含就是最高頻字,即時將它調到第一個重碼字 顯示位置。。 而這些重碼字序就這樣被定下來了,到了WINDOWS一直延用,時間往前推進,雖然人們用 字習慣會隨環境改變,字頻序會跟著變,但輸入法對照表卻不能隨意跟著變動,因使用者 在不同系統間或前後版本間重複字的順序如果不一致會很困擾,有些行列使用者用了十幾 二十年,一切都已變成直覺,聽到要調整重碼字序,可能都要跳起來了,且不同輸入系統 間很難一齊更新,像微軟系統內含的輸入法更新可不是容易的事,作輸入法就是要考慮很 多。 如果要改可能來一次大改版,直接用字頻表來作對照表,輸入時一面按鍵就把最高頻的字 從頭列出當作簡碼,新近推出的行列10數字輸入法 就是直接用字頻排序對照表,老刀已 把它實現在LIME系統供智慧型手機使用者下載使用,我自己試用還蠻理想的。 轉錄網址http://hyperrate.com/thread.php?tid=21714 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.193.217.47

03/30 11:58, , 1F
話說 win7 內建行列的 3v0^7^ 「溫」被改到第一個了
03/30 11:58, 1F

03/30 11:59, , 2F
同時用 XP 和 win7 就很困擾 XD
03/30 11:59, 2F

05/10 21:09, , 3F
若要說怕老用家們不習慣新的編碼,這點廖老師多慮了啊。
05/10 21:09, 3F

05/10 21:12, , 4F
微軟怎能忍受輸入法老用家一成不變地進而減退適應力呢?
05/10 21:12, 4F

05/10 21:14, , 5F
而且在96碼之後行列官方亦提供了較XP更新的編碼表……
05/10 21:14, 5F

05/10 21:15, , 6F
令人不解的是,像"滿"字明明很好打,卻編入特碼。
05/10 21:15, 6F

05/10 21:17, , 7F
而將很難打的"減"字,摒於簡特碼天堂之門外……
05/10 21:17, 7F

05/10 21:23, , 8F
簡特碼收編指法難度高的常用字,效率應高於以字頻收編。
05/10 21:23, 8F

05/10 21:25, , 9F
輸入法最終都應該以「輸入效率」論其優劣。編碼合理與否
05/10 21:25, 9F

05/10 21:27, , 10F
(簡特碼之編碼合理與否)真有如此重要?
05/10 21:27, 10F

05/10 21:31, , 11F
以上是長年以來的使用感想,在下願意多花一些時間記碼。
05/10 21:31, 11F

05/10 21:33, , 12F
……來換取輸入中文時,能更輕鬆、省力的指法。
05/10 21:33, 12F

07/24 09:50, , 13F
完全不考慮用哪隻指頭敲了幾次按鍵嗎....
07/24 09:50, 13F

07/24 09:51, , 14F
連那麼遙遠的「減」都還有這種依理論不依人性的說法...
07/24 09:51, 14F
文章代碼(AID): #1DaZtngy (Array)