python3.x - python lxml解析gbk

 手机用户2502863161 发布于 2022-10-26 06:51

单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教

自用自答,不好好看官网文档真害人,文档中的解决方法贴一下:

parser = etree.XMLParser(encoding='gbk') #这里还可以传入很多参数来定制你的parser
tree = etree.parser(file, parser=parser)

可以解决读gbk的问题,lxml功能确实很强大,建议大家使用前先大致看看文档吧,能省很多时间的,谢谢大家的作答!希望上面的代码可以帮到大家

2 个回答
  • 如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup

    soup = BeautifulSoup(html, from_encoding="gbk")

    beautifulsoup encoding部分的文档

    解析网页的话, bs4很好用的orz

    使用bs解析xml: http://www.cnblogs.com/liulix...

    发现了这个: https://segmentfault.com/a/11...
    你可以试试

    2022-10-27 00:33 回答
  • 把你的文本 .decode(encoding="gbk")输出试试

    2022-10-27 00:33 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有