Re: [問題] Python抓露天網頁的疑問
※ 引述《flywindy2002 (巧克力)》之銘言:
: 大家好~
: 小女子是研究Python的超級新手>"<
: 之前本來有用JAVA寫抓網頁的程式
: 但是因為效能問題和露天抓不到(不知道是被檔還是什麼)
: 所以正在研究Python抓露天
: 想先測試一下
: 所以寫了以下簡單的程式
:
: import urllib2
: page = urllib2.urlopen('http://www.ruten.com.tw/')
: for line in page:
: print line
:
: 當網址是YAHOO和GOOGLE都沒問題
: 但是改成露天就會出現以下的問題
: Access Deny!! Detect your Browser to install malicious plug-in or Illegal
: access. (A999)
: 嘗試Google了一下也找不到答案
: 希望能有高手幫忙解惑 Q_Q
: 非常感謝!!!
import urllib2
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
url = "http://www.ruten.com.tw/"
req= urllib2.Request(url,"",headers)
response = urllib2.urlopen(req)
content = response.read().split("\n")
for line in content:
print line
#break
#試看看吧^_^~
--
3WA訓練家的工作室
宗旨:諸葛單中,謝謝
個人佈弱格 網址:http://3wa.tw
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.240.117.97
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):