python urllib2 字符乱码的问题

 xXxHolicxXx900 发布于 2022-11-05 02:37
r1=urllib2.Request(url,None,headers)
opener = urllib2.build_opener()
opener.addheaders.append(('Cookie', cookie_str))
response=opener.open(r1)
if response.info().get('Content-Encoding') == 'gzip':
    d = zlib.decompressobj(16+zlib.MAX_WBITS)
    #buf = StringIO( response.read())
    #f = gzip.GzipFile(fileobj=buf)
    #text = f.read()
    READ_BLOCK_SIZE = 1024*8
    stre=''
    while True:
        data = response.read(READ_BLOCK_SIZE)
        if not data: break
        stre+=data

    text = d.decompress(stre)
else :
    text=response.read()

将text写入文件后发现个别字符乱码,其他的都是正常的,不知道是怎么回事?
�t鱼养殖前景效益看好,莫失时机
鮰鱼养殖前景效益看好,莫失时机
所有的“鮰”都是乱码“�t”
环境是python 2.7,windows下,不知道该怎么解决呢?

2 个回答
    1. 请求还是建议使用现在比较好用的requests了。代码清晰且书写方便。

    2. 是什么编码的看看,这种情况可能是gbk编码的 先使用decode将编码转回unicode 再使用encode成utf-8即可。

    3. 还要就要要问问题。。问题和代码能详细一点吗。。

    2022-11-12 01:52 回答
  • 需要设置字符集为utf8

    2022-11-12 01:52 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有