Re: [洽特] 用Calibre抓取本本在E變態資訊
前略,安裝calibre 請參考上一篇教學
感謝熊貓~
熊貓復活後, calibre 可以找到更完整的資料了~
以下繼續介紹calibre 的設定
calibre 除了可以匯入熊貓 資料以外,也可以做到客製化
我將利用目前我匯入同人本的步驟寫下, 可以作為參考
如果同人本需要保留原作名稱可以下載我修改的plugin v1.1.3.1
以下步驟有保留原作名稱, 如果不用可以跳過
https://mega.nz/#!goNXWYqR!S55FV8lED0RtgIVRPJaPUjMwWzsfZ4aeEjrfYgICAYU
A.1. 前置設定
偏好設定->自訂欄位 自定義不同的欄位值, 參考如下:
https://imgur.com/Q3GAAep
1. #chname, 中文名, long text (純文字, 備註用)
2. #parody_name, 原作品, Comma sparated text..., (同人誌使用, 放原作品名(日文)
3. #notice, 備註欄, Comma sparated text..., (在e-hentai找不到時 標記)
以下設定需要了解正規表達式與calibre 自訂的py 函式, 如果使用的是跟我相同的格式
可以參考我的設定
舉例來說我從e-hentai 得到的tag 格式:
96_語言.translated, 98_原作.original, 04_團隊.yuu adashino suisan, 99_artist.isshi taira, 01_女性.bondage, Doujinshi
4. #comictype, 種類, 從其他欄位建立的新欄位...,
範本: {tag:list_re(\,,^(\D),\1)}
5. #famale, 女性, 從其他欄位建立的新欄位...,
範本: {tag:list_re(\,,(01_女性\.)(.*),\2)}
6. #group, 團隊, 從其他欄位建立的新欄位...,
範本: {tag:list_re(\,,(04_團隊.)(.*),\2)}
7. #male, 男性, 從其他欄位建立的新欄位...,
範本: {tag:list_re(\,,(02_男性.)(.*),\2)}
8. #misc, 喜好, 從其他欄位建立的新欄位...,
範本: {tag:list_re(\,,(03_雜項.)(.*),\2)}
9. #parody, 原作, 從其他欄位建立的新欄位..,
範本: {tag:list_re(\,,(98_原作.)(.*),\2)}
10. #character, 角色, 從其他欄位建立的新欄位..,
範本: {tag:list_re(\,,(97_角色\.)(.*),\2)}
https://imgur.com/s8U6JXd
因為新增欄位需要重啟calibre, 建議新增欄位時, 範本可以隨便打, 並先勾選顯示欄
位, 重啟calibre後直接點任一本有tag書本的欄位修改/測試範本,沒問題後隱藏欄位
https://imgur.com/NaHMm5G
如果範本設定正確你可以看到calibre 會根據tag "自動"更新欄位 結果如下圖:(藍色字
體部分式超連結可找到含有相同tag 的書籍)
https://imgur.com/0bs0KbQ
P.S. 如果需要可以將 "典籍作者名稱應該.." 改成 "在calibre書庫搜尋做作者"
開始匯入書本:
1.1. 找一個欄位區分整理前後的欄位,方便記錄整理的資料
我是使用預設的"系列"做區分 "-" 表示"系列" 是空值的情況,代表還沒有處理的資料
也可以另外建立欄位紀錄
1.2. 將檔案拖曳到calibre將檔案拖曳到calibre 匯入, 不同種類書本匯入動作有些許差
異,但流程不變
根據上一篇提供的正規表達式可以包含9成以上的資料,建議匯入時以同樣種類本本一起匯
入,
如果希望根據不同的種類( 單行本, 同人誌...etc)定義不同的正規表達式
可以嘗試安裝plugin "Quick Preferences" 後 將"Quick Preferences" 放到主工具列
此plugin 可以紀錄並快速切換匯入書本的正規表達式
1.3. 確認檔案是否為CBZ 格式, 如果不是匯出書本為.zip 整理符合calibre CBZ 格式後
重新匯入
1.4. 右下角"配置" 開啟"封面窗格" 確認封面是否正確 (HoneyView 直接複製(ctrl+c)
想要的封面 在書本詳細資料中右鍵貼上)
https://imgur.com/TZxluze
!!注意!! 以下步驟將會修改title 資料,建議了解正規式, 並確認預覽沒有問題後執行
2.1. 在搜尋欄輸入: series:false and title:"[" and title:"]"
過濾出有問題的資料或是不需要搜尋的值如: [Chinese],[XX汉化组]
整理資料後清除[ ]資料,
全選(ctrl+A)--> 右鍵-->編輯詮釋資料-->批次編輯詮釋資料-->搜尋及取代
搜尋模式: Regular expression
搜尋欄位: title
搜尋:(.*)\[.*\]
取代為: \1
目的端欄位 title 模式: "取代"
https://imgur.com/qRBA3Jk
參考設定如下, 沒問題可以儲存起來使用
2.2. 在搜尋欄輸入: series:false and title:"(" and title:")"
找出title 有包含原作名稱的資料, 全選(ctrl+A)--> 右鍵-->編輯詮釋資料-->批次編輯
詮釋資料-->搜尋及取代
搜尋模式: Regular expression
搜尋欄位: title
搜尋:[^\(\)].*\((.*)\).*
取代為: \1
目的端欄位 #parody_name 模式: "取代"
參考設定如下, 沒問題可以儲存起來使用
https://imgur.com/CZNTjPW
確認沒有問題後點"儲存"
2.3. 移除title 原作名, 讓cilibre 更容易找到熊貓資料
搜尋模式: Regular expression
搜尋欄位: title
搜尋:(.*)\((.*)\).*
取代為: \1
目的端欄位 title 模式: "取代"
https://imgur.com/3SlJ3hp
確認沒有問題後點"確定" 離開設定頁面
2.4. 返回series:false: 下載資料
全選(ctrl+A)-->下載詮釋資料(ctrl+D)-->僅下載詮釋資料, 等待完成(完成期間盡量不
要動作)
下載完成後選"是" 等待匯入完成, 可以看到剩下4本沒有找到資料
https://imgur.com/POCX921
2.5. 按照經驗,此問題通常與作者名稱有關,移除作者名稱后再一次下載4本書 詮釋資料
3 下載詮釋資料(ctrl+D), 剩下兩本沒有找到資料,單獨針對這兩本處理
3.1 複製並保存原始title"關鍵字"(可以先放在comment中), 將title 放回calibre書的
title 重新搜尋,
如果還是沒有資料依序將"空格"與特殊字元(!@#$%^&..) 移除後重新搜尋
https://imgur.com/uIY9EmB
3.2 到熊貓搜尋, 如果找到相同封面與名稱的表示e-hentai 上有資料,
複製到熊貓上找到書的 "英文title", 不包含"作者名" "原作名" [chinese] 等資料
找到資料,確認資料正確後下載tag,
P.S 如果有搜到資料但不是你要的( 常發生在一系列的書籍如:姉なるもの) 可以用檢視
紀錄中找到對應的書名,將資料手動複製到欄位中後,
利用tag mapper 重新整理tag (注意點選的書籍),整理正確上面設定的欄位應該會自動改
成正確的值
P.S1: 找不到可以在設定-->工具列與選單-->主工具列 中將tag mapper 放入"目前的動
作"
P.S2: tag mapper 設定可以從詮釋資料下載設定中儲存後匯入
3.3 如果還是找不到資料, "書本詳細資料"右鍵-->在網路搜尋這本書 找回作者名稱後,
將#notice標註 "無熊貓資料"
4 重複2.2 動作,在搜尋欄輸入: series:false and title:"(" and title:")"
此步驟是為了將保持原作名一致性 如: fate/stay night 的/ 無法用在從檔案名稱匯入
找出title 有包含原作名稱的資料, 全選(ctrl+A)--> 右鍵-->編輯詮釋資料-->批次編輯
詮釋資料-->搜尋及取代
搜尋模式: Regular expression
搜尋欄位: title
搜尋:[^\(\)].*\((.*)\).*
取代為: \1
目的端欄位 #parody_name 模式: "取代"
確認沒有問題後點"確定" 離開設定頁面
不用移除title 原作名稱
5 全部完成後根據 "種類" 用批次設定將分類不同系列, 直到series:false 清空, 再整
理下一組
6. 如果匯入的書本太多, 有可能遇到名稱重複或是錯誤的書籍,
可以利用plugin "Fiund duplicates", 整理書籍
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.182.141 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1565015041.A.DAE.html
推
08/05 23:06,
4年前
, 1F
08/05 23:06, 1F
→
08/05 23:07,
4年前
, 2F
08/05 23:07, 2F
推
08/06 10:59,
4年前
, 3F
08/06 10:59, 3F
推
08/06 12:31,
4年前
, 4F
08/06 12:31, 4F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):