openKylin论坛

 找回密码

python 抓取网页资源 [复制链接]

本帖最后由 bunny 于 2013-7-10 15:12 编辑

今天在调试是抓取不到网页资源,主要是因为python2*和python3一些接口改变了,
比如:
  1. import urllib2
  2. content_stream = urllib2.urlopen('http://www.baidu.com/')
  3. content = content_stream.read()
  4. print content
复制代码
在Python 2.7.5+上执行运行正常,在python3就会报错。。。
在python3中需要这样写:
  1. import urllib.request
  2. response = urllib.request.urlopen('http://www.baidu.com/')
  3. html = response.read()
复制代码
从网上看到一个帖子,转过来备用。。。。
python3 抓取网页资源的 N 种方法
【转】http://www.cnblogs.com/txw1958/archive/2011/12/21/2295698.html


楼主
发表于 2013-7-10 15:10:35
回复

使用道具 举报

openKylin

GMT+8, 2024-6-1 16:15 , Processed in 0.018137 second(s), 17 queries , Gzip On.

Copyright ©2022 openKylin. All Rights Reserved .

ICP No. 15002470-12 Tianjin

快速回复 返回顶部 返回列表