[閒聊] 自寫程式用GOOGLE找專輯插圖
最近正自學網路抓取,
剛好來試試看自動化用GOOGLE來找圖片。
因為是自學的,可能有些BUG,
所以請斟酌使用唷。
程式是用Python寫的,之後經過pyinstaller轉成exe的版本,
可以先看看原始程式碼有沒有問題,再考慮使用exe版本。
原始碼py檔:
https://drive.google.com/file/d/1VJhEPkb3s2leHckrUbQnUM3KE5LtZ1Uv/view?usp=sharing
exe檔:
https://drive.google.com/file/d/1mYQfWxTw5QbyuIE5S9JYSKQoPCJbYaDR/view?usp=sharing
程式碼可以隨便使用,沒關係。
運作方式:
1.
先選擇音樂檔案目錄,搜尋會把裡面所有子目錄找過。
2.
搜尋時,如果資料夾內有cover或front.jpg(png)會跳過(但無法偵測內嵌圖片)。
3.
開始後會隨機挑一個音樂檔讀取專輯名稱和作者,以供之後搜尋。所以如果不同專輯的檔
案混在一起只會找一張專輯圖片。
4.
開始用GOOGLE搜尋圖片,只會挑第一張圖片。想了一下要不要加入影像辨識提高正確率,
還是決定先這樣當粗掃就好。
5.
如果有勾選Save Image就會存JPG檔在音樂檔案目錄內,如果沒有勾選就只會搜尋但圖片
不會存檔。也建議一開始使用不要勾選玩玩看。
6.
結束會有總結報告,可以針對失敗的案例手動加入專輯圖片。
這個程式使用上,較推薦用來第一次粗掃大量專輯圖片,
就自動化丟著給他跑就好了,之後再個別修改。
另外我還不會非同步抓取,所以使用這個程式速度可能有點慢,
不過應該就不會有被伺服器封IP的風險了吧?
映像中也有其他搜尋專輯圖片的程式,不過沒用過..
好像是找資料庫的方法。
而用GOOGLE的方法就是再冷門通常還是可以找到點東西。
如果有其他想法也可以提出來,看還能怎麼改。
謝謝各位~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.88.196
※ 文章網址: https://www.ptt.cc/bbs/Headphone/M.1532077911.A.A36.html
推
07/20 17:13,
5年前
, 1F
07/20 17:13, 1F
圖片版權應該還好吧...私用不賣錢應該OK的。
推
07/20 17:13,
5年前
, 2F
07/20 17:13, 2F
不不不,版上臥虎藏龍,看到程式碼亂成這樣會笑出來吧...
推
07/20 17:18,
5年前
, 3F
07/20 17:18, 3F
※ 編輯: yuro1470 (114.45.88.196), 07/20/2018 17:30:46
推
07/20 17:33,
5年前
, 4F
07/20 17:33, 4F
→
07/20 17:34,
5年前
, 5F
07/20 17:34, 5F
→
07/20 17:36,
5年前
, 6F
07/20 17:36, 6F
筆記一下。
→
07/20 17:57,
5年前
, 7F
07/20 17:57, 7F
推
07/20 18:05,
5年前
, 8F
07/20 18:05, 8F
謝謝~
現實狀況可能性太多種,感覺例外會寫很長,
比較實際的作法應該會是找各個有公信力網站作為參考,
比較出正確圖片後,藉由GOOGLE找出高解析檔案,以後再試看看吧。
推
07/20 18:24,
5年前
, 9F
07/20 18:24, 9F
※ 編輯: yuro1470 (114.45.88.196), 07/20/2018 22:44:43
推
07/20 23:04,
5年前
, 10F
07/20 23:04, 10F
推
07/20 23:43,
5年前
, 11F
07/20 23:43, 11F
推
07/21 01:28,
5年前
, 12F
07/21 01:28, 12F
推
07/21 10:12,
5年前
, 13F
07/21 10:12, 13F
→
07/21 10:12,
5年前
, 14F
07/21 10:12, 14F
→
07/21 10:12,
5年前
, 15F
07/21 10:12, 15F
推
07/22 15:14,
5年前
, 16F
07/22 15:14, 16F
學多了些後,發現Google的robots.txt禁止bot找/search網域,
所以我先把EXE檔案不分享了,之後改成找Amazon好了,
圖片品質不錯外,他也沒不歡迎bot的樣子。
※ 編輯: yuro1470 (163.20.23.14), 07/31/2018 09:23:11
做了些小更新,功能基本一樣
https://github.com/YuJungChou/SimpleCoverDownloader/releases
未來除了再增加可以選擇搜索引擎的功能
也試試看能夠手動自己選擇圖片的功能好了
※ 編輯: yuro1470 (123.194.23.221 臺灣), 06/17/2019 13:21:21