py2与py3中使用urllib库
Urllib是Python提供的一个用于操作URL的模块,我们爬取网页的时候,经常需要用到这个库。
升级合并后,模块中的包的位置变化的地方较多。在此,列举一些常见的位置变动,方便之前用Python2.x的朋友在使用Python3.x的时候可以快速掌握。
常见的变化有:
在Pytho2.x中使用import urllib2-------对应的,在Python3.x中会使用import urllib.request,urllib.error。
在Pytho2.x中使用import urllib -------对应的,在Python3.x中会使用import urllib.request,urllib.error,urllib.parse。
在Pytho2.x中使用import urlparse-------对应的,在Python3.x中会使用import urllib.parse。
在Pytho2.x中使用import urlopen-------对应的,在Python3.x中会使用import urllib.request.urlopen。
在Pytho2.x中使用import urlencode-------对应的,在Python3.x中会使用import urllib.parse.urlencode。
在Pytho2.x中使用import urllib.quote-------对应的,在Python3.x中会使用import urllib.request.quote。
在Pytho2.x中使用cookielib.CookieJar-------对应的,在Python3.x中会使用http.CookieJar。
在Pytho2.x中使用urllib2.Request-------对应的,在Python3.x中会使用urllib.request.Request。
有时候会遇到一些py2的脚本,import的库跟py3不一样,可以对照上面改一下