作者查詢 / bluecadence
作者 bluecadence 在 PTT [ Python ] 看板的留言(推文), 共160則
限定看板:Python
看板排序:
全部Eng-Class548Physics472S.H.E404Stock403R_Language273Python160Gossiping142Linux98nCoV201961MAC57I-Lan50Road_Running48Chemistry44FITNESS30Trading17AntiVirus14Option14A-MEI12Google12iOS10DataScience9MuscleBeach9Storage_Zone9WomenTalk9popmusic7Statistics7TY_Research7Foreign_Inv6Database5Windows5CodeJob4Plant4Starbucks4DigiCurrency3Fix-Network3Soft_Job3Office2PttHistory2StupidClown2Bank_Service1Golden-Award1joke1MayDay1PublicIssue1Sodagreen1Tainan1<< 收起看板(46)
5F→: error message 不是很清楚嗎 "Background processes02/15 12:15
6F→: not supported"02/15 12:16
7F→: 你執行命令裡面的 & 就是在跑 background job02/15 12:17
1F→: 使用 subplot 沒問題。 add_trace 裡面有 row, col11/15 19:24
2F→: 兩個參數讓你指定 trace 要放進哪個 subplot11/15 19:24
1F推: 你有試過 plotly.py 嗎? https://plot.ly/python/02/27 01:52
1F推: from pyvirtualdisplay import Display02/21 11:34
2F→: display = Display(visible=0, size=(1024, 768))02/21 11:34
3F→: display.start()02/21 11:35
4F→: ......02/21 11:35
5F→: display.stop()02/21 11:36
5F→: 開個終端機 然後輸入指令11/16 21:09
6F→: $cd /Users/yaboo/Desktop11/16 21:10
7F→: $python3 hello.py11/16 21:10
13F→: 你有兩個問題 1. 你把python script 當成bash script11/16 21:36
14F→: 在跑 2. 你的檔案permission, chmod u+x hello.py11/16 21:37
15F→: 可是問題你要跑python script 就用 python3 hello.py11/16 21:38
16F→: 根本不用管 hello.py 的 permission(只要可讀就可跑)11/16 21:38
17F→: 你如果想直接打 hello.py 跑程式,你 script 第一行11/16 21:52
18F→: #!/usr/bin/python3 <-- 看你的python3的路徑在哪11/16 21:53
19F→: 然後你必須讓你的script有可執行的permission11/16 21:54
20F→: chmod u+x hello.py11/16 21:54
21F→: 你第一行沒有 #!/你的python路徑/python3 終端機當然11/16 21:55
22F→: 把他當成 shell script 跑11/16 21:55
24F→: 你不只需要python的知識,你沒有unix簡單概念,你跑11/16 21:58
25F→: 不起來的。11/16 21:59
26F→: 找本unix 或osx 的書看吧11/16 22:00
44F推: 餵CNN影像基本上不必處理 頂多丟掉對辨識沒幫助的彩11/09 20:02
45F→: 色 轉成灰階。五個字整張圖餵進去練,99%辨識率很容11/09 20:05
46F→: 易。不要一直餵已經答對的圖案,把辨識錯誤的圖加進11/09 20:06
47F→: 去訓練很重要11/09 20:07
48F→: training set 3000 張基本上就可以 95% 了11/09 20:07
50F→: 對不必切割 原圖整張餵11/09 20:22
53F→: 用傳統比對法 才有必要切割, 既然都用 cnn 了,就不11/09 20:59
54F→: 必多此一舉了 :p11/09 21:00
78F推: 如果會切圖只辨識一個字母或數字,要訓練 1~Nmax 字11/10 08:48
79F→: 流程一模一樣,重點是cnn幾層,模型怎麼建的。一般的11/10 08:50
80F→: 網站都是固定字數,可以針對特定網站訓練。11/10 08:50
81F→: 我使用三層 conv layer 一層 fully connected 然後11/10 08:56
82F→: output layer 。 我針對兩個網站都是五個字的圖做解11/10 08:56
83F→: 析,每天抓上千筆資料 真的正確率就是 > 99% 很少看11/10 08:57
84F→: 見錯誤的。我也是寫了這個tensorflow小程式 被 cnn11/10 08:59
85F→: 的威力嚇到 開始小玩tensorflow11/10 09:00
86F→: 文字數字是非常有特徵的物件 辨識真的不難阿...11/10 09:06
87F→: 我不知道各位切圖一個字後怎麼做cnn,我的作法是把11/10 09:21
88F→: 字母數字先向量化,整張圖一維化,然後餵進 nn 這好11/10 09:22
89F→: 像是蠻標準的程序(之一)阿11/10 09:22
90F→: 而且如果需要窮盡所有樣板可能性,才能讓NN學會,你11/10 09:30
91F→: 需要的是一個完整可以比對的資料庫,不是NN11/10 09:30
92F→: NN的概念不就是要舉一反N嗎,而不是舉N反N11/10 09:31
93F→: 我的確相信 NN 在訓練的過程中,把看過的東西都"記憶11/10 09:38
94F→: "下來了(在連結權重的網中),但你給他一張新的沒看過11/10 09:39
95F→: 的五字辨識圖,它的確幫你判斷出來了,這是除了記憶11/10 09:40
96F→: 外,它也歸類了辨識圖中的一些文字數字特徵,然後給11/10 09:41
97F→: 出了正確答案。11/10 09:41
98F→: 神經網路怎麼學習的,最近讀到一個 information11/10 10:02
99F→: bottleneck 的說法,我覺得還蠻有趣的,可以 google11/10 10:02
100F→: 關鍵字參考一下11/10 10:03
104F→: http://bsr.twse.com.tw/bshtm/11/10 11:35
105F→: http://www.tpex.org.tw/web/stock/aftertrading/bro11/10 11:36
106F→: kerBS.php11/10 11:36
107F→: 我不知道這種算難還是不難?11/10 11:36
108F→: 位置不固定會旋轉我覺得更應該不切割直接餵11/10 11:44
109F→: 這不就是cnn的優點強項嗎?11/10 11:45
110F→: 人臉辨識 不在照片固定位置 角度不同 扭曲 不是都能11/10 11:46
111F→: 作到某種程度了嗎?11/10 11:46
116F→: 推文打太快漏了字,一維化然後 reshape (所以還是二11/11 10:27
117F→: 維陣列) 抱歉讓您誤會11/11 10:28
118F→: 另外為什麼我說用有平移旋轉更應該用cnn 請google關11/11 10:30
119F→: 鍵字 translation, rotation invariance + cnn11/11 10:32
123F→: 只是配合tensorflow語法保持彈性可以動態指定批次圖11/11 16:44
124F→: 檔數量。我短時間內並沒有把程式碼放在github開源的11/11 16:46
125F→: 打算。11/11 16:46
139F→: 可以反問一下alan大 為何需要輸出上萬個class?11/13 22:02
140F→: 如果你認為切割後比較有效率 那就切割吧。同樣的問題11/13 22:04
141F→: 可以有很多種不同的解法。我只是告訴你固定五的字的11/13 22:05
142F→: captcha,我可以不切割做辨識達到實戰 >99% 的正確率11/13 22:06
143F→: 既然我不open source 你就當我唬爛嘴砲好了 :p11/13 22:07
147F→: 那就把模型建成輸出層輸出六個字,把空白用 * 或隨便11/13 23:41
148F→: 一個特殊字元代表。 你得到的答案會像這樣11/13 23:42
149F→: *4A*QC 12CEK 5*DQE4 少於六個字的空白輸出都會用*11/13 23:43
150F→: 也就是把空白當成一個字元 也給他一個向量11/13 23:44
151F→: 當然你回到網站輸入驗證碼的時候要把*去掉11/13 23:46
152F→: 12CEKQ <- 剛剛少打一個字元11/13 23:48
153F→: 只要你的訓練樣本夠 4~6 個字都有餵進去練就好11/13 23:49
154F→: 不過你訓練樣本的標示可能會些困難 需要斟酌11/13 23:52
155F→: 我沒有試過,或許標示直接給四個字,尾巴填兩格空白11/13 23:56
156F→: 五個字+一個空白 這樣標11/13 23:57
157F→: 訓練組這樣標示,答案就會像這樣 AXD2** 35CP*11/13 23:59
158F→: 35CPR* (剛剛漏字)11/14 00:00
159F→: 我是把標示都直接標在圖檔檔名,所以不能用 * 代表11/14 00:01
160F→: 可以選擇用 - 或 _ 代表空白11/14 00:02
161F→: 推文推的有點亂 忽略我第三行推文。總結就是用最大可11/14 00:10
162F→: 能的碼數當作輸出層的輸出,訓練組標示 四個字的用11/14 00:11
163F→: ABCD-- 五個字的 XQYZE- 六個字的 QWERTY11/14 00:12
164F→: 你的字元集Aa..Zz 0..9 之外再加上一個空白字元"-"11/14 01:00
167F→: 我只能說你解captcha的模型有問題 隨你要怎麼做就怎11/14 09:51
168F→: 麼做 建出的模型是要解決問題的 你想了一個解決不了11/14 09:52
169F→: 問題的模型 我也管不著11/14 09:52
170F→: 你可以繼續困在你解決不了問題的思維裡 請便11/14 09:54
171F→: 你不會做不切割不代表別人不會做 這種辨識碼CNN出來11/14 09:56
172F→: 之後基本上根本可以廢了 根本完全被破解了11/14 09:57
173F→: 不然你以為為何google要重搞 reCAPTCHA?11/14 10:02
174F→: 你已經落後三四年了11/14 10:03
175F→: 一個class對應一個字元 你是有幾個字元阿?11/14 10:10
176F→: 你的問題是你不會設計輸出層 就這樣而已11/14 10:20
177F→: 要教NN舉一反三很難 教人也是11/14 10:44
178F→: 網路上的例子都只開一條馬路 不能自己開六條馬路嗎?11/14 10:49
179F→: "multiplexing" ...11/14 10:50
15F推: 除非要玩文字探勘不然架這個用途想不太出要做什麼,11/07 15:21
16F→: 不如架一個股票股價相關資訊的資料庫應該會大受歡迎11/07 15:23
17F→: (純屬個人偏見)11/07 15:24
18F→: 不過受歡迎後吃掉的頻寬/資源就很可觀了 :p11/07 15:27
1F→: from bs4 import BeautifulSoup ?10/25 17:13
3F推: 這種用 tensorflow 寫個三層 CNN 訓練一下就解決了09/05 22:15
4F→: 要作到辨識成功率到99%不難09/05 22:16
1F推: 用指令 which pip3, which pip3.6, which pip3.5 看09/01 01:24
2F→: 看你的 pip3 到底都裝到哪裡去了09/01 01:25