作者:我只当你的千纸鹤 | 来源:互联网 | 2023-01-27 19:59
所以我要处理一些看起来像这样的xml:
206
...
我找到了lxml和它的objectify模块,它允许你以pythonic的方式遍历xml文档,就像字典一样.
问题是:每次尝试访问元素时都使用伪造的xml命名空间,如下所示:
from lxml import objectify
tree = objectify.fromstring(xml)
print tree.artist
# ERROR: no such child: {http://api.example.com}artist
它试图访问使用父命名空间,但标记不使用ns.
任何想法如何解决这个问题?谢谢
解决方法:
根据lxml.objectify documentation,属性查找默认使用其父元素的命名空间.
你可能想要的工作是:
print tree["{}artist"]
如果你的孩子有一个非空的命名空间(例如“{http://foo/} artist”),这样的QName语法会起作用,但不幸的是,它看起来像当前的源代码将空命名空间视为没有命名空间,因此所有objectify的查找善良将有助于用父命名空间替换空命名空间,你运气不好.
这可能是一个bug(“{}艺术家”应该工作),或者是为lxml人提交的增强请求.
目前,最好的办法可能是:
print tree.xpath("artist")
我不清楚你在这里使用xpath会有多大的性能影响,但这肯定有效.