[流案] BBS抓取字串程式(用perl會不會比較容 …

看板CodeJob作者 (血拼)時間15年前 (2008/11/14 09:00), 編輯推噓14(14027)
留言41則, 16人參與, 最新討論串1/1
案件狀態:發包中  發案人:聯絡方式1:站內信 有效時間:專案說明: 1.使用者輸入看板名稱、帳號、密碼 2.登入並抓取ptt該看板內所有文章 3.搜尋所有文章內的發(修)文者IP、推文者IP 4.將IP、發文或推文者ID、文章編號、文章或推文內容存入excel檔中   預算:請來信報價 接案者要求:請真的能完成的人來接案 在這邊遇到好多做一半後說不會了的人   附註:     (以下內容鼓勵結案後填寫,可以詢問接案人願不願意暴光接案身份) 結案意見:  接案人: 評價(0-10):   說明: ※ 編輯: A11 來自: 211.74.12.67 (11/14 09:04)

11/14 10:10, , 1F
HI~我有興趣~可不可以把之前別人的SOURCE CODE 給我呢?
11/14 10:10, 1F

11/14 10:10, , 2F
或者提供一下別人的作法
11/14 10:10, 2F

11/14 11:00, , 3F
PTT不是有web版?
11/14 11:00, 3F

11/14 12:23, , 4F
以前就做過類似的東西了 :p
11/14 12:23, 4F

11/14 12:23, , 5F
不過以前是做Query站上所有使用者的id/來源ip建檔...抓分身
11/14 12:23, 5F

11/14 12:24, , 6F
這個問題麻煩的不在瀏覽 , 而是在識別的pattern.
11/14 12:24, 6F

11/14 12:25, , 7F
以及因為外在因素而使得連線中斷時 , 資料要怎麼處理. :p
11/14 12:25, 7F

11/14 12:26, , 8F
以這個問題來講我會開不低的價 , 要撈出ip pattern , 還要
11/14 12:26, 8F

11/14 12:26, , 9F
做各種資料的切塊 , 再加上瀏覽所有資料本身的工 ,
11/14 12:26, 9F

11/14 12:27, , 10F
跟其他的東西比起來 , 這沒有個四五萬是不會有人想做的.
11/14 12:27, 10F

11/14 12:28, , 11F
之前有做過某組屋網 web介面界接bbs bot發表到某站租屋版 ,
11/14 12:28, 11F

11/14 12:28, , 12F
單就這功能就收入整整15k左右...:p
11/14 12:28, 12F

11/14 12:29, , 13F
而且這收入還不算多 , 你真的會想砸錢在這些資料上嗎?
11/14 12:29, 13F

11/14 12:32, , 14F
btw 至於作法 , 其實就非常單純 , 開個socket 接到bbs去 ,
11/14 12:32, 14F

11/14 12:34, , 15F
然後送訊息收訊息 , 純文字 , 除了控制碼的* 要改esc (0x1b)
11/14 12:34, 15F

11/14 12:35, , 16F
enter 改送 crlf , 至於上下左右的操作有一個pattern
11/14 12:35, 16F

11/14 12:35, , 17F
是兩個ascii的組合鍵 , 程式不在手邊突然想不起來是哪些.:p
11/14 12:35, 17F

11/14 12:36, , 18F
雖然說原理實在是不難 , 但是很費工 , 加上門檻高. :p
11/14 12:36, 18F

11/14 13:04, , 19F
囧 Tony 兄 可以回一篇文章了啦
11/14 13:04, 19F

11/14 13:12, , 20F
我也覺得這個要做起來不便宜.. 直接抓 web 簡單多了
11/14 13:12, 20F

11/14 14:19, , 21F
有人都寫好,源碼都放在網路上讓人下載了...
11/14 14:19, 21F

11/14 15:30, , 22F
樓上,願聞其詳 :P
11/14 15:30, 22F

11/14 19:28, , 23F
樓上...要善用 google 阿...:p
11/14 19:28, 23F

11/14 22:46, , 24F
樓上...至少也給個關鍵字好嗎...:p 我猜是 PHP Telnet?
11/14 22:46, 24F

11/14 23:43, , 25F
我只知道用 ztelnet 去改寫 bbs bot 啊 0rz
11/14 23:43, 25F

11/15 21:22, , 26F
最接近的大概是 bbs to html 的backup程式吧 ,
11/15 21:22, 26F

11/15 21:22, , 27F
就算是這樣 , 離原作者要的東西還是有一段加工啊...
11/15 21:22, 27F

11/15 21:23, , 28F
這個工的麻煩在於, 把一大片的具有特定syntax純文字轉成有
11/15 21:23, 28F

11/15 21:23, , 29F
系統的資料 ... 真的有程式已經做了這些分析嗎? :p
11/15 21:23, 29F

11/15 21:58, , 30F
再加點油,你還沒google我說的程式...
11/15 21:58, 30F

11/15 22:01, , 31F
這東西用regular expression來做簡單又快
11/15 22:01, 31F

11/15 22:27, , 32F
pfory , 何不來個關鍵字? :p
11/15 22:27, 32F

11/15 22:58, , 33F
PTT 抓取
11/15 22:58, 33F

11/15 23:59, , 34F
這是我上一段推文中 bbs2html http://briian.com/?p=2727
11/15 23:59, 34F

11/15 23:59, , 35F
所說得東西, 它還不夠理想 , 有別的嗎? :p
11/15 23:59, 35F

11/19 16:26, , 36F
樓上的東西還不錯~~謝拉!
11/19 16:26, 36F

11/20 22:36, , 37F
這算高門檻嗎?
11/20 22:36, 37F

11/21 14:30, , 38F
以8000~20000可以找的人才中 , 算很高門檻.:p
11/21 14:30, 38F

11/25 22:37, , 39F
丁丁貝殼???
11/25 22:37, 39F

02/05 23:11, , 41F
最高能夠有多少報酬?需要GUI嗎?原始碼?手冊?平台為何?
02/05 23:11, 41F
文章代碼(AID): #197CtBMS (CodeJob)