Re: [情報] 線上笈成資料庫
※ 引述《danny0838 (道可道非常道)》之銘言:
: 感謝版主回饋,先回應幾部分:
: 標題用(1)、(2)之類的是備考本,
: 有些書有二個以上的電子檔來源,品質較好的為正本,品質較差的為備考本,
: 原則上是打算把備考本的內容合併到正本,然後刪除備考本。
了解,我沒有細看內容就提出建議,是我的問題。抱歉。
: 版本問題就頭痛了...
: 像傷寒論宋本和桂林古本的差異,當然是當二本書處理;
: 但有時書與書之間會有一些微妙的小差異,這些版本差異要怎麼標注就是問題。
在文獻校訂工作時,有一種做法是,本文用比較正確或比較多版本使用的字句,
底下加腳註「某本做甲字」、「某本做乙字」之類。再精細一點就連為什麼從某
字都一併附在註腳中。
: 另外異體字的使用也是問題,像參古字薓,有些字的古字還要造字。
: 用字遵循原本,會比較精確,但搜尋上會比較麻煩;
: 用現代標準字,比較利於檢索和搜尋,
: 但哪些字維持原本,哪些字改現代字,會有很多爭議。
: 不知大家有什麼想法?
我有一個想法,不過還很有討論修訂的空間:
專有名詞解釋部分維持原字,一般內文非特殊名詞則統一成近字。例如:
人薓。音參。或省做蓡。 → 保留薓和蓡,全轉成參大概一堆讀者會翻桌?
逐諸冷痹頑。 → 古字「痹」轉近字「痺」之類。
鈆錫莫辨。橙柚不分。 → 這個要不要改「鈆」為「鉛」就比較有爭議。
不過這種轉法在實務上應該還是會遇到不少問題,包括「修治」或「脩治」等,
這可能要主作者群先討論協定完,然後公布個基本規章提醒共編者要先看之類。
還有就是標點符號,很多今注會用現代標點,但不同人對下何種標點的見解容易
差異很大,也許可以考慮統一如古文只用「。」斷句就好?
: 大大方便提供幾張螢幕擷圖嗎?
^^^^我很小,雖然詳情不知,但不管怎麼比我應該都是晚輩 XDDD
過兩天考完試再去圖書館弄截圖給你 @@
: 該電子書是只能瀏覽嗎?可否選取、複製、貼上、搜尋?
我記得是可以,一樣過兩天再回你確定的答案,抱歉。
: 如果文本是純文字,只加上大字小字差異,直版實做上不難。
: 癥結是目前資料有很多格式標記,甚至可插入圖片、超連結,實做上會很困難;
: 另外直版不利於搜尋,很有可能搜尋還是得切換成橫版XD
: 如果做成像《好讀》那樣的介面,格式只保留純文字及小字,可以接受嗎?
嘛,我知道線上系統要做成那樣是比較辛苦啦,其實原版也沒什麼不好,只是私
心喜歡看古典排版所以就提了,這部分不用跟我認真沒關係 (′‧ω‧‵)
: 修修補補的萬國碼系統不利漢字使用,已經不是趨勢了,
: 現在大部分的研究都朝向動態組字的模式,這樣才能無限添加需要的漢字。
畢竟我們這邊做文獻的老師年紀都不小,對資訊方面都不太行,這部分是我以自
己所知去推想的,看來是我的資訊腿得太嚴重了……請問有推薦相關的書籍或資
料可以讓我補足一下這部分的新知嗎 (つд⊂)
: 目前的問題不是缺字無法補足,而是 php 實做不出真正的組字引擎,
: 只好借用漢字構形資料庫及全字庫,二資料庫未提供的字形再自已畫。
這部分我真的不懂……對不起我先去找資工(?)出身的惡補一下再回來
。・゚(゚⊃ω⊂゚)゚・。
呃,糟糕,本篇好像都在懺悔,沒什麼有營養的內容 ( ̄ー ̄;)
--
《思時》
人不輕狂枉少年,三載落魄似雲煙;花開花落年空過,人往人來事不全。
井蛙猶知日常照,玉兔不見月少圓;木猶如此十圍抱,意向桃李不謂言!
庚寅庚辰壬辰
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 121.254.127.194
討論串 (同標題文章)