HTML:
Example website
水果:苹果 运动:足球 语言:中文
我想得到这样的结果:
>>> response.xpath('//p[@id="demo"]/p/text()').re(r'') u'苹果' >>> response.xpath('//p[@id="demo"]/p/text()').re(r'') u'足球' >>> response.xpath('//p[@id="demo"]/p/text()').re(r'') u'中文'
问题:
上面re(r'')
中的正则表达式该怎么写?
import re a = u'水果:苹果 运动:足球 语言:中文' print re.findall(u'[\u4E00-\u9FA5]+?:([\u4E00-\u9FA5]+)', a)