本帖最后由 bunny 于 2013-7-10 15:12 编辑
今天在调试是抓取不到网页资源,主要是因为python2*和python3一些接口改变了,
比如:- import urllib2
- content_stream = urllib2.urlopen('http://www.baidu.com/')
- content = content_stream.read()
- print content
复制代码 在Python 2.7.5+上执行运行正常,在python3就会报错。。。
在python3中需要这样写:- import urllib.request
- response = urllib.request.urlopen('http://www.baidu.com/')
- html = response.read()
复制代码 从网上看到一个帖子,转过来备用。。。。
python3 抓取网页资源的 N 种方法
【转】http://www.cnblogs.com/txw1958/archive/2011/12/21/2295698.html
|