[成案] 收集無名帳號~ (洽談中)

看板CodeJob作者 (sily)時間15年前 (2010/08/14 13:36), 編輯推噓16(16023)
留言39則, 17人參與, 最新討論串1/1
案件狀態:已成案  發案人:silly 聯絡方式1:站內信 有效時間:越快越好 專案說明:無名帳號不重複名單350萬筆↑   預算:1.5w 接案者要求:都可以 接受新手承案否:沒意見   附註:一定是要是不重複的無名帳號名單,紀錄方法是 使用記事本紀錄! 例: i25622 c25712 t25123 (350萬筆不重複名單)  我相信懂程式的可以使用軟體自動抓取無名帳號名單 (就像是自動收集Mail軟體一樣) 目前需要350萬筆不一樣的帳號名單! 當然有能力的人也可以收集更多名單 500萬↑ 有問題在站內信給我吧!感謝     (以下內容鼓勵結案後填寫,可以詢問接案人願不願意暴光接案身份) 結案意見:  接案人: 評價(0-10):   說明: -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 111.252.40.253 現在是8/14 下午5點 蠻多人願意接這個案子的 (至少10人) 讓我不知道怎麼選擇 ! 有站內信給我的 我都會回復 站內信盡量告訴我大家的優勢 我相信這個板上很多人才 感謝大家^^ ※ 編輯: SODAECHO1 來自: 111.252.40.253 (08/14 17:08) 已經找到人做了^^" 感謝大家來信 往後也許還會有類似的案件 在上來找大家幫忙吧 感謝! ※ 編輯: SODAECHO1 來自: 111.252.40.253 (08/14 19:21)

08/15 02:00, , 1F
直接幫你寫程式讓你自己抓?
08/15 02:00, 1F

08/15 02:10, , 2F
樓上,這樣怎麼知道到底抓了多少,一邊說可以抓一千萬
08/15 02:10, 2F

08/15 02:10, , 3F
一邊說我只抓到一千
08/15 02:10, 3F

08/15 09:14, , 4F
程式抓不難,但是很容易沒幾筆就被鎖IP了
08/15 09:14, 4F

08/15 10:02, , 5F
配合多張網卡與撥號程式應該可解
08/15 10:02, 5F

08/15 10:10, , 6F
無名真正有在使用的ID有沒有1百萬都不知道@@
08/15 10:10, 6F

08/15 10:33, , 7F
重點是速度..案主好像很急 我昨天開程式抓幾個小時
08/15 10:33, 7F

08/15 10:33, , 8F
也不過幾萬筆 要350萬看來要多機器+map reduce..
08/15 10:33, 8F

08/15 11:32, , 9F
我抓到2W5就被999了ˊˋ
08/15 11:32, 9F

08/15 14:20, , 10F
1台機器就可以了 多線程 同時每個給不同表頭
08/15 14:20, 10F

08/15 14:21, , 11F
必要時定期切ip 我以前看過網路上有人有寫
08/15 14:21, 11F

08/15 14:21, , 12F
大概10多分鐘可以抓百萬筆左右
08/15 14:21, 12F

08/15 20:21, , 13F
不要看我,不是我....(逃)
08/15 20:21, 13F

08/15 20:43, , 14F
各位請教一下 如果像Java HttpClient4同instance做request
08/15 20:43, 14F

08/15 20:43, , 15F
一樣也會出現999嗎??(具體觀念意思是同一session)
08/15 20:43, 15F

08/15 20:59, , 16F
那個重點在於伺服端怎麼指認你,而你要如何不讓對方辨識
08/15 20:59, 16F

08/15 21:32, , 17F
有前輩可以提供些關鍵字嗎,我也想試著處理這類問題,謝謝!
08/15 21:32, 17F

08/15 21:42, , 18F
http client / proxy / html parser / crawler
08/15 21:42, 18F

08/15 21:43, , 19F
扯到 wolf 講的東西的話,可能會需要再加上route/pppoe
08/15 21:43, 19F

08/15 22:20, , 20F
999是被yahoo買下之後才會有的新計倆吧?
08/15 22:20, 20F

08/15 22:22, , 21F
tony講的都關鍵字 proxy的話 至少我以前試簡單切proxy法
08/15 22:22, 21F

08/15 22:23, , 22F
對加了999後的yahoo沒效果 他發現了我的陰謀 得再加料?
08/15 22:23, 22F

08/16 02:39, , 23F
先思考一下:IE連上去後會回報什麼,以及SERVER會到什麼
08/16 02:39, 23F

08/16 02:39, , 24F
然後你能夠變動什麼?這樣仔細想想自然發現他拿什麼指認
08/16 02:39, 24F

08/16 02:40, , 25F
而你也可以拿什麼呼楞對方.....
08/16 02:40, 25F

08/16 11:02, , 26F
有意思..但來源ip有辨法用程式修改嗎?
08/16 11:02, 26F

08/16 12:34, , 27F
樓上 用proxy....
08/16 12:34, 27F

08/16 23:53, , 28F
一般OPEN PROXY都會被列入黑名單,用PROXY很難躲的。除非
08/16 23:53, 28F

08/16 23:54, , 29F
放蠱攻佔殭屍堡壘,不過這樣是違法的。但是ADSL帳號爛掉
08/16 23:54, 29F

08/16 23:55, , 30F
就爛掉,你目標達到就好....所以最佳解是多張網卡勤換IP
08/16 23:55, 30F

08/20 00:54, , 31F
我以前抓過 手上應該不只350萬 我是WARM的作者 請來信恰談
08/20 00:54, 31F

08/20 11:05, , 32F
你們都想太多了 其實無名有Bug可以跳過999
08/20 11:05, 32F

08/20 11:07, , 33F
三年前的Bug沒想到留到現在還在...XD
08/20 11:07, 33F

08/20 11:07, , 34F
可以思考看看 什麼東西很頻繁存取 卻又不會被擋下來
08/20 11:07, 34F

08/21 18:51, , 35F
真的假的 這也太帥了 XD
08/21 18:51, 35F

09/01 17:14, , 36F
這真的是不錯的課題 感謝分享
09/01 17:14, 36F

09/03 23:59, , 37F
頻繁存取 卻又不會被擋下來 蜘蛛人嗎? 是嗎是嗎?
09/03 23:59, 37F

09/14 06:03, , 38F
建立免洗新帳號?
09/14 06:03, 38F

09/14 06:04, , 39F
還是透過yahoo的搜尋引擎去做網路蜘蛛?
09/14 06:04, 39F
文章代碼(AID): #1CPYj7hZ (CodeJob)