cwlr.net
当前位置:首页 >> python2 urlDECoDE >>

python2 urlDECoDE

#python3 import urllib.parseprint(urllib.parse.unquote("%E6%B5%8B%E8%AF%95abc"))

ubuntu 的控制台默认是utf8编码的吧。而且这个google返回的是big5编码吗,用下面的代码解码下试试 url="网址" content = urllib2.urlopen(url).read() print content.decode('big5').encode('utf8')

url编码: import urllib url = 'http://test.com/s?wd=哈哈' #如果此网站编码是gbk的话,需要进行解码,从gbk解码成unicode,再从Unicode编码编码为utf-8格式。 url = url.decode('gbk', 'replace') print urllib.quote(url.encode('utf-8', 'r...

1、python2与python3稍微有点区别 2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码 3、将unicode转换成中文,只需要用deconde解码就可以了 >>> u='欢迎'>>> e=u.encode()>>> eb'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.d...

你试试下面的代码 #!/usr/bin/env python# -*- coding:utf8 -*-import urllib2req = urllib2.Request("http://www.baidu.com/")res = urllib2.urlopen(req)html = res.read()res.close()html = unicode(html, "gb2312").encode("utf8")print html

content=html.read().decode("utf-8") 改成 content=html.read().decode("gbk") 就可以了

确实改变了,改为这样: urllib.request.urlretrieve(imgurl,'%s.jpg' % x)

网站首页 | 网站地图
All rights reserved Powered by www.cwlr.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com