作者查詢 / Hsins
作者 Hsins 在 PTT [ Python ] 看板的留言(推文), 共674則
限定看板:Python
看板排序:
全部Soft_Job2532WomenTalk1300Gossiping1002Python674L_LifeJob344nb-shopping191mud133CareerPlan109guitar83graduate76Web_Design70LaTeX65NTU56Blog40Tech_Job36Civil34toberich31Linux23soho19CodeJob18Lifeismoney15Boy-Girl14TOEIC14tutor13DigitalMusic11DSLR10Google10HomeTeach10DataScience9MIS9Women_Picket8Master_D7Windows7java6TaichungBun6TrinityBlood6Cancer5LCD5Teacher5HatePolitics4mud_sanc4R_Language4StudyGroup4Trans-nctu4Transfer4CSMU-OSH3DC_SALE3Free_box3joke3AllTogether2SENIORHIGH2StupidClown2Beauty1book1FITNESS1HardwareSale1Hsinchu1iOS1MacShop1Math1movie1Notebook1NTUcourse1Oversea_Job1Prob_Solve1studyabroad1Sub_CS1TWSU1<< 收起看板(68)
8F→: 要看你用哪個 packages 處理, 有的需要先轉 XML 再處理, 有11/14 07:33
9F→: 的是直接透過 COM 去調用 Office 物件, 效率有差異11/14 07:34
1F→: 那篇文裡面最一開始給出用 list comeprehension 的實現已11/13 17:53
2F→: 經夠快了. 認真說起來... 你這個函數還多了不必要的操作...11/13 17:54
1F→: 我在 issue 裡面有附上一個連結,不同的瀏覽器在處理字體11/05 10:31
2F→: 回退也都是有各自的實作方式,火狐的滿認真看待中日韓字元11/05 10:32
3F→: 的,chromium 很有趣,一部分是寫死的。然後我還順便研究11/05 10:32
4F→: 了一下在 xeCJK 這個中英混合排版的 xelatex 套件的處理方11/05 10:33
5F→: 式,跟火狐有點像又有些不同,還有處理一些字元的映射問題11/05 10:33
8F→: 欸斗,我只是打字的時候因為標點和不想添加太多語助詞才會11/05 15:23
9F→: 這樣看起來很激動啦...11/05 15:23
3F→: 小腳本的話 GitHub Action 就可以了10/29 21:52
4F→: 如果本來已經有伺服器不需要考慮成本就忽略我說的吧,檔案10/29 21:53
5F→: 放上去 crontab 就好10/29 21:53
8F→: 可以用定期 trigger 不一定要 branch 有變動,比如我寫了一10/30 22:01
9F→: 個小爬蟲爬每日 trending 的10/30 22:01
10F→: https://github.com/Hsins/Daily-GitHub-Trending10/30 22:01
11F→: 雖然是 js 不過換成 py 也行,反正都是啟動一個機器去跑,10/30 22:02
12F→: 還有一個我放隱私的 repo 會每天固定登入 批踢踢的10/30 22:02
1F→: 你的問題敘述沒頭沒尾的。純粹執行 Python 腳本通常是直接10/29 06:18
2F→: 丟請求取東西回來,要嘛就是取頁面原始碼再透過 selector10/29 06:18
3F→: 或 xpath 定位,又或是直接字串透過正則表達式做 parsing,10/29 06:18
4F→: 這時的記憶體不足會是腳本可能有 memory leak 或者是讀入過10/29 06:18
5F→: 量的資料。如果還需要開瀏覽器,通常是有需要加載 js 才會10/29 06:18
6F→: 渲染頁面,要嘛 headless 要嘛 seleium,至少要交代一下吧10/29 06:18
7F→: ?瀏覽器跳記憶體不足的原因有很多啊,你腳本是不是會一直10/29 06:18
8F→: 開新分頁?又或者是要一直下拉載入新內容?還是其他?10/29 06:18
9F→: 如果是開太多分頁或記憶體沒清,就去找文件看看那個方法可10/29 06:22
10F→: 以調用去關分頁或者是清理瀏覽器的記憶體,然後在腳本裡呼10/29 06:22
11F→: 叫。如果清了記憶體就不能爬了,那就找其他的爬法…10/29 06:22
12F→: 搞不好是對方網站載入的 js 有沒寫好的東西一直堆上去…10/29 06:24
13F→: 如果你需要爬的東西,是重啟瀏覽器之後直接運行腳本繼續爬10/29 06:32
14F→: 也沒差,容錯率比較高的話。寫個腳本定期去殺掉進程,然後10/29 06:32
15F→: 重啟會比較快速無腦10/29 06:32
1F→: 你要做的就是數位訊號處理中會遇到的問題,常見的做法就是10/28 03:41
2F→: 濾波,有各種函數可以使用,時頻分析一般會用傅立葉轉換或10/28 03:41
3F→: 小波轉換處理10/28 03:41
4F→: 如果是常見的訊號,找看看有沒有寫好的,不然你還要補數學10/28 03:42
5F→: 和訊號的學科基礎。10/28 03:42
10F→: 看規模跟用途,小規模用 fastapk 或 flask 就可以,至於 dj10/14 14:38
11F→: ango 有點太龐大了10/14 14:38
31F→: flask 很適合拿來做微服務10/16 13:41
33F推: DRF 就殺雞焉用牛刀的概念啊…10/16 21:47
66F→: 你要說一下卡在哪吧?文件範例滿清楚的…10/21 06:40
2F→: 先學會把問題描述清楚…10/06 15:28
1F→: OneDrive 要提供 Python SDK,取得驗證之後可以呼叫 API 上06/22 06:56
2F→: 傳下載檔案。06/22 06:56
3F→: *有提供06/22 06:56
1F→: BTW,如果你會經常使用某一個環境,可以用 alias 或是 ln03/14 19:53
2F→: 建立別名或建立 soft link 的方式來處理。03/14 19:53
8F→: pyenv 也可以像 rvm 跟 npm 那樣建制不同版本的環境,不過03/16 01:16
9F→: 都有用 conda 的話,我覺得就多此一舉了... 雖然肥很多03/16 01:17