作者查詢 / f496328mm

總覽項目: 發文 | 留言 | 暱稱
作者 f496328mm 在 PTT [ Python ] 看板的留言(推文), 共344則
限定看板:Python
Re: [問題] 在學習程式語言,如何做到有效率的學習
[ Python ]13 留言, 推噓總分: +4
作者: vi000246 - 發表於 2018/01/03 00:33(8年前)
2Ff496328mm: 推selenium,可以說是萬解,不過缺點是速度比較慢01/03 07:35
Fw: [問題] 在學習程式語言,如何做到有效率的學習
[ Python ]28 留言, 推噓總分: +4
作者: jamesxxx1997 - 發表於 2018/01/02 16:08(8年前)
6Ff496328mm: 建議有個目標 單純學習會沒什麼感覺01/02 17:05
15Ff496328mm: 建議一步一步來 先從簡單的爬蟲開始01/02 22:27
[問題] 請問關於np array轉換
[ Python ]3 留言, 推噓總分: 0
作者: Danielxx - 發表於 2018/01/02 17:58(8年前)
2Ff496328mm: datatime01/02 18:22
[問題] 該去報名課程還是自學
[ Python ]14 留言, 推噓總分: +5
作者: michael16547 - 發表於 2018/01/02 13:15(8年前)
9Ff496328mm: 零基礎的話,建議去上課,雖然網路上很多免費課程,相01/02 18:21
10Ff496328mm: 關書籍也多,但程式0基礎會有點困難01/02 18:21
[心得] 以CNN實作台鐵驗證碼辨識
[ Python ]44 留言, 推噓總分: +19
作者: jason860421 - 發表於 2017/12/24 23:53(8年前)
4Ff496328mm: 推,另外提一點,真正要去辨識台鐵驗證碼時,會遇到驗12/25 00:09
5Ff496328mm: 證碼是js的問題,動態圖,不好抓,你動一次它就變一次12/25 00:09
22Ff496328mm: 這篇討論串都有講到關鍵點 蠻不錯的12/25 18:41
23Ff496328mm: 大致上看完 寫的蠻不錯的 很有幫助12/25 23:07
[問題] 爬蟲form data內容疑問
[ Python ]6 留言, 推噓總分: +3
作者: unhumanWu - 發表於 2017/12/23 18:57(8年前)
1Ff496328mm: 轉編碼?12/23 21:36
[問題] 用 selenium 搶票
[ Python ]198 留言, 推噓總分: +41
作者: kh555069 - 發表於 2017/11/08 10:39(8年前)
5Ff496328mm: 驗證碼識別蠻簡單的,我有做一個11/08 12:29
22Ff496328mm: 驗證碼,自己做一個CNN就好了,麻煩的是,驗證碼是JS,11/09 10:04
23Ff496328mm: 直接抓會一直變,我是用selenium截圖後,再去處理11/09 10:04
24Ff496328mm: 另外我是手動做train data,目前1萬張11/09 10:05
26Ff496328mm: 很累啊,我也試過一大堆方法,都有現成套件,但都有些11/09 13:39
27Ff496328mm: 缺陷,結果都不好,demo時都很猛,實際上不見得好11/09 13:39
28Ff496328mm: 標解答,也可以寫成程式,盡量提高速度啦,我一開始一11/09 13:41
29Ff496328mm: 天就可以1萬張,5個驗證碼大約90%正確率,剩下就可以利11/09 13:41
30Ff496328mm: 用台鐵驗證碼系統,幫我上label啦11/09 13:41
31Ff496328mm: 簡單講,對或錯台鐵會幫我判定,對的就存label,這樣就11/09 13:45
32Ff496328mm: 變成自動上label啦,data會越來越多,有點類似reinforc11/09 13:45
33Ff496328mm: ement learning,當然這很像ddos攻擊,是不太好啦11/09 13:45
37Ff496328mm: 之後你data越多,基本上準確率越高11/09 16:23
41Ff496328mm: 還有一點是,在辨識之前,你的影像處理好不好,對之後11/09 19:32
42Ff496328mm: 的辨識,影響很大11/09 19:32
43Ff496328mm: 另外台鐵算是最簡單的驗證碼,有些連人都很難辨識11/09 19:32
49Ff496328mm: 是一整張圖辨識?我目前是切割,分開辨識11/09 20:11
51Ff496328mm: 了解,因為切割也很麻煩,台鐵還算可以切,其他的很複11/09 20:29
52Ff496328mm: 雜11/09 20:29
72Ff496328mm: 單純用CNN做分類的話,5個數字,有10^5種組合耶,況且11/10 07:00
73Ff496328mm: 有時是4個數字,有時是6個,真的可以不切割?11/10 07:00
74Ff496328mm: alan,我的數字影像處理,切割+旋轉,之後再用CNN,1萬11/10 07:10
75Ff496328mm: 張圖,大約80~90%正確率11/10 07:10
76Ff496328mm: 其實驗證碼的影像處理,網路上一大堆人做過,可以去找11/10 07:11
77Ff496328mm: 找11/10 07:11
114Ff496328mm: 感謝開示11/11 09:03
115Ff496328mm: 一維化,所以沒有用到pooling?11/11 09:32
120Ff496328mm: blue大有github可以參考嗎?感恩11/11 11:23
121Ff496328mm: 問一個問題,圖片本來不是2維嗎?為什麼要先一維化,再11/11 13:37
122Ff496328mm: 變2維?改變整張圖的大小嗎?11/11 13:37
126Ff496328mm: ok,那我自己研究看看11/11 18:36
144Ff496328mm: 比較想問,如果沒固定5個字的話,可以不切割嗎?因為台11/13 23:25
145Ff496328mm: 鐵驗證碼,4~6個字11/13 23:25
146Ff496328mm: 因為難一點的驗證碼,非常難切割,有些都黏在一起11/13 23:26
185Ff496328mm: 這串討論蠻不錯的,講了很多重點,感謝上面的大大11/15 13:36
198Ff496328mm: 切割有缺點,切的不好會影響結果,error會累加上去11/28 21:19
[問題] json 與 dataframe 互轉排序問題
[ Python ]29 留言, 推噓總分: +5
作者: m87dd05 - 發表於 2017/11/28 15:47(8年前)
11Ff496328mm: 我印象中,欄位是按照a-z去自動排的,可以再下指令讓11/28 16:53
12Ff496328mm: 欄位順序變成你要的11/28 16:53
[問題] 非結構化資料結構化?
[ Python ]3 留言, 推噓總分: +2
作者: Nancy010006 - 發表於 2017/11/13 20:01(8年前)
1Ff496328mm: 我也想問類似問題11/13 23:23
[討論] 分享個人爬蟲資料 ( PTT文章 )
[ Python ]23 留言, 推噓總分: +7
作者: f496328mm - 發表於 2017/11/04 21:40(8年前)
12Ff496328mm: 樓上其實說的沒錯,爬蟲有點遊走在法律邊緣,甚至有些11/06 20:05
13Ff496328mm: 網站會擋,程式瀏覽網頁跟人的行為非常不同,不難抓/11/06 20:05
14Ff496328mm: 擋11/06 20:05
19Ff496328mm: 我的目的就是text mining、nlp11/07 20:18
20Ff496328mm: 目前在當兵,PTT也快抓完了,會再去抓其他data11/08 07:10
23Ff496328mm: chan,我目前都沒遇到過,爬新聞、雜誌等等都沒遇到11/13 19:40