Re: [思辯] 如果沒有通用語言英語的話?會怎樣呢?

看板ask-why作者 (無想流流星拳)時間16年前 (2008/05/12 05:49), 編輯推噓4(4020)
留言24則, 4人參與, 最新討論串21/21 (看更多)
※ 引述《haryewkun (Har)》之銘言: : ※ 引述《souldragon (仆街)》之銘言: : 用英文,你輸入“m”、“o”、“r”、“n”、“i”、“n”、“g”,就 : 可以成為一個單詞。 : 用中文,你輸入直、折、橫、橫、橫、直,你能夠認出這是什麼字嗎? 事實上組合語言只是代碼, 用「mov」和單純用一個「m」來表達 , 或者簡單的「01000101」是沒有分別的, 同樣, 數字是否存在 也是沒關係的. 所謂組合語言的指令, 只是一種一對一的編碼, 本質等於直接輸入二進制. 我的看法並不一樣, 站在科研人員的角度看, 我認為如果初期電 腦是用中文來開發的話, 首先有一點是, 大概不會追求「表達所 有中文」. 開發是量力而為的行為, 會根據目前所有的技術和資源, 去表達 最接近自己所想的東西, 不會因為無法完全表達, 就索性放棄. 打個比方說, 假設中期的機器只能夠顯示二十六種不同的輸出, 那麼, 當然是遠遠不能表達中國所謂的三千常用字. 但是否因此 開發就會有阻礙? 如果二十六是一個不可打破的限制的話, 那科 研人員的答案, 就是從中文當中選二十六個最常用的字出來. 可 能是「的」, 「我」, 「他」, 「你」, 「得」之類. 又或者像簡體字一樣, 將所有同音, 近音的字合拼作一個. 或者 使用注音符號代替中文. 就算真的是「直折橫橫橫直」, 也絕對 是可以的, 一般人認不出是甚麼字根本就沒有所謂, 因為電腦初 期從來都是設計給科研人員使用而不是一般人. 這種做法是常見的. 雖然忘了是哪個, 好像是甚麼「魔牌」之類 , 當時因為不方便輸出中文, 便真的有用注音符號代替中文的電 腦遊戲存在. 而初期的電腦遊戲很難內置輸入法, 又想要讓玩者 輸入中文, 都是用一個只有一頁, 數量極有限的檢字表, 將名字 常用的字例如「陳張李偉雄志強」套進去. 而且我們很多時都忘了, 電腦原本就是數學用的機器, 表達英文 和中文, 根本就完全比不上表達數式重要. 可是這就更麻煩了, 數字比起語文, 有更多幾何的表達方式, 比方說, 要表達次元方 程, 要表達分數, 還有各種括號, 要怎樣表達? 結果我們發明了 Shift+6 按出來的那個東西: ^ 也發明了 Polish Notation, 一種將數式全部變成橫式的方式, 也就是這樣才使使用 Compiler 的 High-Level Language 變得 可行. 那我們今天才有 C 這種小朋友都學得懂的語言可寫, 不 用人人寫組合語言. 人類顯示語文的困難度, 跟要將數學可以在 電腦上計算要花的心力和工夫相比, 也只是小意思而已. 窮變則通, 沒有必要一開始就完全兼容. 初期的 GB 碼也對繁體 字的支援有限, 也是後來才擴充上去的. 況且另一方面, 我們不能忽視的是, 其實中文數碼化的歷史比我 們想像中還早. 因為並不是只有電腦才需要用到中文編碼的, 在 一百二十年前的電報, 就已經需要用到中文編碼. 到了今天, 香 港身份證會用到的「中文電碼」, 便是百多年來的產品, 用一個 四位的阿拉伯數目字, 去代表一個中文. 當初傳電報的成本也很昂貴, 自然也會產生和現代一樣的為了記 憶體而節省成本的問題. 結果很有趣地, 方法就是用上了中國傳 統學問的「韻目代日」, 用地支代替月份, 以及大量使用精簡的 文言文. 是否中文真的一定用得較多容量? 其實有時是相反的, 因為數碼 化之後都只是二進位串, 英文一個單字用的字元數可以很長, 而 同意思的中文詞語, 在數字上比較反而可以更短. 至少人名和地 名方面, 中文用的容量就遠遠比英文少. 即使要去到兼容大部份中文也就是初期中文電腦的程度 (例如小 教授電腦) , 初期的 16x15 中文顯示需要的容量是每個 15 Byte , 三千字就是 45000 byte 也就是 44k. 還不足一個 page. 可以 燒上 ROM 上. 其實需要的容量是初期微電腦(寫出這詞語時我心 想, 可能今天已沒人用這個詞語了?)可以接受的水平. 如果我們 要說那個還是用真空管的時代, 那其實光是想將數字變成平常人 能看得到的文字這想法已經很昂貴了. 所以當時有些科幻小說激進到認為人類會為了電腦索性放棄英文. -- 基於飲水思源的理念, 還是該打的廣告, hkday.net --- 碩果僅存還願意和其他地區轉信的香港 BBS -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.252.90.21

05/12 08:54, , 1F
是30byte 當時的主記憶體只有640k 90k的rom cost也不低
05/12 08:54, 1F

05/12 10:40, , 2F
那個四位數字代碼還有在用喔...童子軍還在用XD
05/12 10:40, 2F

05/12 10:41, , 3F
撿字表那個...現在常見的大概是TV GAME之類的在用= =;
05/12 10:41, 3F

05/12 11:17, , 4F
我記錯了, 的確是 30 byte, 我忘了是複式的.
05/12 11:17, 4F

05/12 11:17, , 5F
但 640K 時代已很後期, 而且當時還可以用 HMB / EMS
05/12 11:17, 5F

05/12 11:18, , 6F
相比起整個機器的價錢這沒去到有決定性影響的地步.
05/12 11:18, 6F

05/12 11:19, , 7F
代碼香港身份證一直在用, 還要填在各種表格上, 我自己名
05/12 11:19, 7F

05/12 11:19, , 8F
字的我也懂背了, 不知臺灣和大陸的如何.
05/12 11:19, 8F

05/12 11:25, , 9F
不過我覺得「市場」比起「技術」對這主題影響更大.
05/12 11:25, 9F

05/12 11:25, , 10F
電腦能顯示人類語文並非技術需要, 而是市場需要.
05/12 11:25, 10F

05/12 11:25, , 11F
台灣可能只剩童子軍在用吧........
05/12 11:25, 11F

05/12 11:26, , 12F
大陸可能完全不用了. 我想. 因為那不是簡體的.
05/12 11:26, 12F

05/12 11:28, , 13F
另外, 即使電腦以中文為起始語言, 隨著市場的改變, 日後
05/12 11:28, 13F

05/12 11:29, , 14F
不見得不會變成別的語文, 因為有一點很顯然的, 對於非中
05/12 11:29, 14F

05/12 11:29, , 15F
文母語者, 中文遠比英文難學.
05/12 11:29, 15F

05/12 11:29, , 16F
真正重要的並非電腦內部所用語言, 而是技術文件公用語.
05/12 11:29, 16F

05/12 11:32, , 17F
所以我的答案是:
05/12 11:32, 17F

05/12 11:32, , 18F
1. 在技術上先發展中文電腦是絕對可行的
05/12 11:32, 18F

05/12 11:32, , 19F
2. 但這很可能經不起市場的考驗
05/12 11:32, 19F

05/12 11:33, , 20F
3. 即使電腦用中文發展, 中文使用者還是難以掌握
05/12 11:33, 20F

05/12 11:47, , 21F
說起來, 歷史上還出現過「魔法門簡體」這玩意...
05/12 11:47, 21F

05/12 15:09, , 22F
吾醍餬灌頂也
05/12 15:09, 22F

05/12 15:10, , 23F
您的透徹瞭解令小弟受用不盡
05/12 15:10, 23F

05/14 02:18, , 24F
其實我有些地方說錯了. 還好有人幫忙指正.
05/14 02:18, 24F
文章代碼(AID): #189se1aE (ask-why)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 21 之 21 篇):
文章代碼(AID): #189se1aE (ask-why)