Re: [情報] 線上笈成資料庫

看板ChineseMed作者 (落魄書生)時間12年前 (2012/05/29 03:18), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串5/7 (看更多)
※ 引述《danny0838 (道可道非常道)》之銘言: : 感謝版主回饋,先回應幾部分: : 標題用(1)、(2)之類的是備考本, : 有些書有二個以上的電子檔來源,品質較好的為正本,品質較差的為備考本, : 原則上是打算把備考本的內容合併到正本,然後刪除備考本。 了解,我沒有細看內容就提出建議,是我的問題。抱歉。 : 版本問題就頭痛了... : 像傷寒論宋本和桂林古本的差異,當然是當二本書處理; : 但有時書與書之間會有一些微妙的小差異,這些版本差異要怎麼標注就是問題。 在文獻校訂工作時,有一種做法是,本文用比較正確或比較多版本使用的字句, 底下加腳註「某本做甲字」、「某本做乙字」之類。再精細一點就連為什麼從某 字都一併附在註腳中。 : 另外異體字的使用也是問題,像參古字薓,有些字的古字還要造字。 : 用字遵循原本,會比較精確,但搜尋上會比較麻煩; : 用現代標準字,比較利於檢索和搜尋, : 但哪些字維持原本,哪些字改現代字,會有很多爭議。 : 不知大家有什麼想法? 我有一個想法,不過還很有討論修訂的空間: 專有名詞解釋部分維持原字,一般內文非特殊名詞則統一成近字。例如: 人薓。音參。或省做蓡。 → 保留薓和蓡,全轉成參大概一堆讀者會翻桌? 逐諸冷痹頑。      → 古字「痹」轉近字「痺」之類。 鈆錫莫辨。橙柚不分。  → 這個要不要改「鈆」為「鉛」就比較有爭議。 不過這種轉法在實務上應該還是會遇到不少問題,包括「修治」或「脩治」等, 這可能要主作者群先討論協定完,然後公布個基本規章提醒共編者要先看之類。 還有就是標點符號,很多今注會用現代標點,但不同人對下何種標點的見解容易 差異很大,也許可以考慮統一如古文只用「。」斷句就好? : 大大方便提供幾張螢幕擷圖嗎? ^^^^我很小,雖然詳情不知,但不管怎麼比我應該都是晚輩 XDDD 過兩天考完試再去圖書館弄截圖給你 @@ : 該電子書是只能瀏覽嗎?可否選取、複製、貼上、搜尋? 我記得是可以,一樣過兩天再回你確定的答案,抱歉。 : 如果文本是純文字,只加上大字小字差異,直版實做上不難。 : 癥結是目前資料有很多格式標記,甚至可插入圖片、超連結,實做上會很困難; : 另外直版不利於搜尋,很有可能搜尋還是得切換成橫版XD : 如果做成像《好讀》那樣的介面,格式只保留純文字及小字,可以接受嗎? 嘛,我知道線上系統要做成那樣是比較辛苦啦,其實原版也沒什麼不好,只是私 心喜歡看古典排版所以就提了,這部分不用跟我認真沒關係 (′‧ω‧‵) : 修修補補的萬國碼系統不利漢字使用,已經不是趨勢了, : 現在大部分的研究都朝向動態組字的模式,這樣才能無限添加需要的漢字。 畢竟我們這邊做文獻的老師年紀都不小,對資訊方面都不太行,這部分是我以自 己所知去推想的,看來是我的資訊腿得太嚴重了……請問有推薦相關的書籍或資 料可以讓我補足一下這部分的新知嗎 (つд⊂) : 目前的問題不是缺字無法補足,而是 php 實做不出真正的組字引擎, : 只好借用漢字構形資料庫及全字庫,二資料庫未提供的字形再自已畫。 這部分我真的不懂……對不起我先去找資工(?)出身的惡補一下再回來 。・゚(゚⊃ω⊂゚)゚・。 呃,糟糕,本篇好像都在懺悔,沒什麼有營養的內容 ( ̄ー ̄;) -- 《思時》      人不輕狂枉少年,三載落魄似雲煙;花開花落年空過,人往人來事不全。 井蛙猶知日常照,玉兔不見月少圓;木猶如此十圍抱,意向桃李不謂言!                                 庚寅庚辰壬辰 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 121.254.127.194
文章代碼(AID): #1Fmy-1EP (ChineseMed)
討論串 (同標題文章)
文章代碼(AID): #1Fmy-1EP (ChineseMed)