Re: [洽特] 用Calibre抓取本本在E變態資訊

看板AC_In作者 (昂昂)時間4年前 (2019/08/05 22:24), 編輯推噓3(301)
留言4則, 3人參與, 4年前最新討論串2/2 (看更多)
前略,安裝calibre 請參考上一篇教學 感謝熊貓~ 熊貓復活後, calibre 可以找到更完整的資料了~ 以下繼續介紹calibre 的設定 calibre 除了可以匯入熊貓 資料以外,也可以做到客製化 我將利用目前我匯入同人本的步驟寫下, 可以作為參考 如果同人本需要保留原作名稱可以下載我修改的plugin v1.1.3.1 以下步驟有保留原作名稱, 如果不用可以跳過 https://mega.nz/#!goNXWYqR!S55FV8lED0RtgIVRPJaPUjMwWzsfZ4aeEjrfYgICAYU A.1. 前置設定 偏好設定->自訂欄位 自定義不同的欄位值, 參考如下: https://imgur.com/Q3GAAep
1. #chname, 中文名, long text (純文字, 備註用) 2. #parody_name, 原作品, Comma sparated text..., (同人誌使用, 放原作品名(日文) 3. #notice, 備註欄, Comma sparated text..., (在e-hentai找不到時 標記) 以下設定需要了解正規表達式與calibre 自訂的py 函式, 如果使用的是跟我相同的格式 可以參考我的設定 舉例來說我從e-hentai 得到的tag 格式: 96_語言.translated, 98_原作.original, 04_團隊.yuu adashino suisan, 99_artist.isshi taira, 01_女性.bondage, Doujinshi 4. #comictype, 種類, 從其他欄位建立的新欄位..., 範本: {tag:list_re(\,,^(\D),\1)} 5. #famale, 女性, 從其他欄位建立的新欄位..., 範本: {tag:list_re(\,,(01_女性\.)(.*),\2)} 6. #group, 團隊, 從其他欄位建立的新欄位..., 範本: {tag:list_re(\,,(04_團隊.)(.*),\2)} 7. #male, 男性, 從其他欄位建立的新欄位..., 範本: {tag:list_re(\,,(02_男性.)(.*),\2)} 8. #misc, 喜好, 從其他欄位建立的新欄位..., 範本: {tag:list_re(\,,(03_雜項.)(.*),\2)} 9. #parody, 原作, 從其他欄位建立的新欄位.., 範本: {tag:list_re(\,,(98_原作.)(.*),\2)} 10. #character, 角色, 從其他欄位建立的新欄位.., 範本: {tag:list_re(\,,(97_角色\.)(.*),\2)} https://imgur.com/s8U6JXd
因為新增欄位需要重啟calibre, 建議新增欄位時, 範本可以隨便打, 並先勾選顯示欄 位, 重啟calibre後直接點任一本有tag書本的欄位修改/測試範本,沒問題後隱藏欄位 https://imgur.com/NaHMm5G
如果範本設定正確你可以看到calibre 會根據tag "自動"更新欄位 結果如下圖:(藍色字 體部分式超連結可找到含有相同tag 的書籍) https://imgur.com/0bs0KbQ
https://imgur.com/o6PHIvC
P.S. 如果需要可以將 "典籍作者名稱應該.." 改成 "在calibre書庫搜尋做作者" 開始匯入書本: 1.1. 找一個欄位區分整理前後的欄位,方便記錄整理的資料 我是使用預設的"系列"做區分 "-" 表示"系列" 是空值的情況,代表還沒有處理的資料 也可以另外建立欄位紀錄 1.2. 將檔案拖曳到calibre將檔案拖曳到calibre 匯入, 不同種類書本匯入動作有些許差 異,但流程不變 根據上一篇提供的正規表達式可以包含9成以上的資料,建議匯入時以同樣種類本本一起匯 入, 如果希望根據不同的種類( 單行本, 同人誌...etc)定義不同的正規表達式 可以嘗試安裝plugin "Quick Preferences" 後 將"Quick Preferences" 放到主工具列 此plugin 可以紀錄並快速切換匯入書本的正規表達式 1.3. 確認檔案是否為CBZ 格式, 如果不是匯出書本為.zip 整理符合calibre CBZ 格式後 重新匯入 1.4. 右下角"配置" 開啟"封面窗格" 確認封面是否正確 (HoneyView 直接複製(ctrl+c) 想要的封面 在書本詳細資料中右鍵貼上) https://imgur.com/TZxluze
!!注意!! 以下步驟將會修改title 資料,建議了解正規式, 並確認預覽沒有問題後執行 2.1. 在搜尋欄輸入: series:false and title:"[" and title:"]" 過濾出有問題的資料或是不需要搜尋的值如: [Chinese],[XX汉化组] 整理資料後清除[ ]資料, 全選(ctrl+A)--> 右鍵-->編輯詮釋資料-->批次編輯詮釋資料-->搜尋及取代 搜尋模式: Regular expression 搜尋欄位: title 搜尋:(.*)\[.*\] 取代為: \1 目的端欄位 title 模式: "取代" https://imgur.com/qRBA3Jk
參考設定如下, 沒問題可以儲存起來使用 2.2. 在搜尋欄輸入: series:false and title:"(" and title:")" 找出title 有包含原作名稱的資料, 全選(ctrl+A)--> 右鍵-->編輯詮釋資料-->批次編輯 詮釋資料-->搜尋及取代 搜尋模式: Regular expression 搜尋欄位: title 搜尋:[^\(\)].*\((.*)\).* 取代為: \1 目的端欄位 #parody_name 模式: "取代" 參考設定如下, 沒問題可以儲存起來使用 https://imgur.com/CZNTjPW
確認沒有問題後點"儲存" 2.3. 移除title 原作名, 讓cilibre 更容易找到熊貓資料 搜尋模式: Regular expression 搜尋欄位: title 搜尋:(.*)\((.*)\).* 取代為: \1 目的端欄位 title 模式: "取代" https://imgur.com/3SlJ3hp
確認沒有問題後點"確定" 離開設定頁面 2.4. 返回series:false: 下載資料 全選(ctrl+A)-->下載詮釋資料(ctrl+D)-->僅下載詮釋資料, 等待完成(完成期間盡量不 要動作) 下載完成後選"是" 等待匯入完成, 可以看到剩下4本沒有找到資料 https://imgur.com/POCX921
https://imgur.com/UKbBZGs
2.5. 按照經驗,此問題通常與作者名稱有關,移除作者名稱后再一次下載4本書 詮釋資料 3 下載詮釋資料(ctrl+D), 剩下兩本沒有找到資料,單獨針對這兩本處理 3.1 複製並保存原始title"關鍵字"(可以先放在comment中), 將title 放回calibre書的 title 重新搜尋, 如果還是沒有資料依序將"空格"與特殊字元(!@#$%^&..) 移除後重新搜尋 https://imgur.com/uIY9EmB
3.2 到熊貓搜尋, 如果找到相同封面與名稱的表示e-hentai 上有資料, 複製到熊貓上找到書的 "英文title", 不包含"作者名" "原作名" [chinese] 等資料 找到資料,確認資料正確後下載tag, P.S 如果有搜到資料但不是你要的( 常發生在一系列的書籍如:姉なるもの) 可以用檢視 紀錄中找到對應的書名,將資料手動複製到欄位中後, 利用tag mapper 重新整理tag (注意點選的書籍),整理正確上面設定的欄位應該會自動改 成正確的值 P.S1: 找不到可以在設定-->工具列與選單-->主工具列 中將tag mapper 放入"目前的動 作" P.S2: tag mapper 設定可以從詮釋資料下載設定中儲存後匯入 3.3 如果還是找不到資料, "書本詳細資料"右鍵-->在網路搜尋這本書 找回作者名稱後, 將#notice標註 "無熊貓資料" 4 重複2.2 動作,在搜尋欄輸入: series:false and title:"(" and title:")" 此步驟是為了將保持原作名一致性 如: fate/stay night 的/ 無法用在從檔案名稱匯入 找出title 有包含原作名稱的資料, 全選(ctrl+A)--> 右鍵-->編輯詮釋資料-->批次編輯 詮釋資料-->搜尋及取代 搜尋模式: Regular expression 搜尋欄位: title 搜尋:[^\(\)].*\((.*)\).* 取代為: \1 目的端欄位 #parody_name 模式: "取代" 確認沒有問題後點"確定" 離開設定頁面 不用移除title 原作名稱 5 全部完成後根據 "種類" 用批次設定將分類不同系列, 直到series:false 清空, 再整 理下一組 6. 如果匯入的書本太多, 有可能遇到名稱重複或是錯誤的書籍, 可以利用plugin "Fiund duplicates", 整理書籍 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.182.141 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1565015041.A.DAE.html

08/05 23:06, 4年前 , 1F
先收藏再看
08/05 23:06, 1F

08/05 23:07, 4年前 , 2F
啊,還有感謝大神
08/05 23:07, 2F

08/06 10:59, 4年前 , 3F
靠,你們還可以這樣用Calibre的喔XD
08/06 10:59, 3F

08/06 12:31, 4年前 , 4F
開發calibre的人不是要這樣給你用的
08/06 12:31, 4F
文章代碼(AID): #1TI3m1sk (AC_In)
文章代碼(AID): #1TI3m1sk (AC_In)