在python3中转义XML字符串的未转义数据-EscapeunescapeddataofXMLstringinpython3

作者：想丶风吹叶落 | 来源：互联网 | 2023-05-17 22:21

Iwanttoescapetheunescapeddatainsideaxmlstringe.g.我想在xml字符串中转义未转义的数据。string<tag

I want to escape the unescaped data inside a xml string e.g.

我想在xml字符串中转义未转义的数据。

string = "I want to escape these >, "

来

"I want to escape these >, "

Now, I definitely can't use any xml parsing libraries like xml.dom.minidom or xml.etree because the data is unescaped & will give error
现在，我肯定不能使用任何xml解析库，比如xml.dom。minidom或xml。etree因为数据是不可转义的，会出现错误
In regex, I figure out way to match & get start and end positions of data substing
在regex中，我找到了匹配和获取数据删除的起始和结束位置的方法
```
exp = re.search(">.+?
```

 
 But in re.search, I can't match the exact xml format
但是在re.search中，我不能匹配确切的xml格式 
 If I use re.findall I can't get positions of the substrings found 
 如果我使用re.findall，我无法获得找到的子字符串的位置 
 I could always find positions of found substring by index but that won't be efficient, I want a simple but efficent solution 
 我总是可以通过索引找到找到子串的位置，但这不是有效的，我想要一个简单但有效的解决方案。 
 BeautifulSoup solutions are welcomed but I wish there was some more beautiful way to do it with python's basic libraries 
 我们欢迎漂亮的解决方案，但是我希望有更漂亮的方法来使用python的基本库


                        
                        
                           1 个解决方案
                           
                           
							  
							    #1
							    
							    
							      3  
Perhaps you should be considering re.sub: 
也许你应该考虑一下。 
>>> oldString = 'I want to escape these >, '
>>> newString = re.sub(r"()(.*?)", lambda m: m.group(1) + cgi.escape(m.group(2)) + "", oldString)
>>> print newString
I want to escape these >, 
 
My warning is that the regular expression will definitely break if you have nested tags. See Why is it such a bad idea to parse XML with regex? 
我的警告是，如果有嵌套标签，正则表达式肯定会崩溃。明白为什么用正则表达式解析XML是一个坏主意吗?




    
        
                        python
                        xml
                        regex
                        string
                        ide
                        api
                        dom
                        tree
                        match
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        get
                        XML介绍与使用的概述及标签规则
                    

                    
                                                
                            
                        
                                                
                        本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 17:39:50
                    

                

                
                                
                    
                        format
                        向QTextEdit拖放文件的方法及实现步骤
                    

                    
                                                
                            
                        
                                                
                        本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 16:06:38
                    

                

                                
                    
                    
                
                
                                
                    
                        spring
                        SpringJdbcTemplate的使用详解
                    

                    
                                                
                        本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 14:27:11
                    

                

                
                                
                    
                        spring
                        UVALive6575 Odd and Even Zeroes 数位dp+找规律
                    

                    
                                                
                        本文介绍了UVALive6575题目Odd and Even Zeroes的解法，使用了数位dp和找规律的方法。阶乘的定义和性质被介绍，并给出了一些例子。其中，部分阶乘的尾零个数为奇数，部分为偶数。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 14:19:28
                    

                

                
                                
                    
                        spring
                        CF：3D City Model（小思维）问题解析和代码实现
                    

                    
                                                
                            
                        
                                                
                        本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 14:17:11
                    

                

                
                                
                    
                        数组
                        [大整数乘法] java代码实现
                    

                    
                                                
                            
                        
                                                
                        本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 11:21:32
                    

                

                
                                
                    
                        format
                        Python爬虫中使用正则表达式的方法和注意事项
                    

                    
                                                
                            
                        
                                                
                        本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤，并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法，包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块，并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习，读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 11:51:07
                    

                

                
                                
                    
                        数组
                        在类中定义数组时出错 - Error on defining arrays in class
                    

                    
                                                
                        Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 17:38:12
                    

                

                
                                
                    
                        数组
                        Android开发笔记：使用Picasso加载网络图片等比例缩放
                    

                    
                                                
                        在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 17:34:00
                    

                

                
                                
                    
                        format
                        C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享
                    

                    
                                                
                        本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 15:56:00
                    

                

                
                                
                    
                        数组
                        Java容器中的compareto方法排序原理解析
                    

                    
                                                
                            
                        
                                                
                        本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 13:53:31
                    

                

                
                                
                    
                        数组
                        UIAlertController被解散后如何立即执行代码块
                    

                    
                                                
                        有没有一种方法可以在不继承UIAlertController的子类或不涉及UIAlertActions的情况下 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 13:47:02
                    

                

                
                                
                    
                        js
                        Html5-Canvas实现简易的抽奖转盘效果
                    

                    
                                                
                            
                        
                                                
                        本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果，同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码，并展示了实现的基本效果。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 06:02:20
                    

                

                
                                
                    
                        function
                        C++字符字符串处理及字符集编码方案
                    

                    
                                                
                            
                        
                                                
                        本文介绍了C++中字符字符串处理的问题，并详细解释了字符集编码方案，包括UNICODE、Windows apps采用的UTF-16编码、ASCII、SBCS和DBCS编码方案。同时说明了ANSI C标准和Windows中的字符/字符串数据类型实现。文章还提到了在编译时需要定义UNICODE宏以支持unicode编码，否则将使用windows code page编译。最后，给出了相关的头文件和数据类型定义。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 04:59:58
                    

                

                
                                
                    
                        case
                        Go Cobra命令行工具入门教程
                    

                    
                                                
                            
                        
                                                
                        本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中，如Kubernetes、Hugo和Github CLI等。通过使用Cobra，我们可以快速创建命令行工具，适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 20:02:41

















    

    
        
            
            
                
                
            

            
                想丶风吹叶落            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    function
                
                                
                    spring
                
                                
                    vba
                
                                
                    substring
                
                                
                    javascript
                
                                
                    foreach
                
                                
                    case
                
                                
                    future
                
                                
                    md5
                
                                
                    python3
                
                                
                    timestamp
                
                                
                    hashtable
                
                                
                    eval
                
                                
                    frameworks
                
                                
                    keyword
                
                                
                    dagger
                
                                
                    process
                
                                
                    jsp
                
                                
                    merge
                
                                
                    uml
                
                                
                    testing
                
                                
                    web3
                
                                
                    random
                
                                
                    format
                
                                
                    expression
                
                                
                    数组
                
                                
                    js
                
                                
                    erlang
                
                                
                    iostream
                
                                
                    cpython
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1selenium的三种等待的区别
                
                                
                    2用法_java if else 用法
                
                                
                    3MFC中使用用户剪贴板
                
                                
                    4PHP RSS类的使用方法及在4G中主要使用的技术：如何在PHP中使用RSS技术
                
                                
                    5如何合并磁盘分区？附操作技巧
                
                                
                    6扩大微信小顺序 Page 组织函数，修正性命周期函数
                
                                
                    7转 class和struct最本质的区别
                
                                
                    8AFNetworking、MKNetworkKit和ASIHTTPRequest比较
                
                                
                    9令妃刚生完孩子，为什么乾隆就要她侍寝？
                
                                
                    10webpack dev server运行发生错误
                
                                
                    11免费手机铃声 免费手机铃声在线下载
                
                                
                    122017 年微服务现状总结
                
                                
                    13cocos2d-x 2.x MAC 环境搭建
                
                                
                    14java中 try return finally return（转）
                
                                
                    15电能储存系统行业调研报告市场现状分析与发展前景预测（20212027年）