当前位置: 开发笔记 > 编程语言 > 正文

pythonresub替换多个_Python正则表达式大全（上）

作者：achih | 来源：互联网 | 2023-10-09 20:13

正则表达式阅读本文需要6分钟Python正则表达式正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。re模块也提供了与这些方法功能完全

正则表达式

阅读本文需要6分钟

Python正则表达式

正则表达式是一个特殊的字符序列&＃xff0c;它能帮助你方便的检查一个字符串是否与某种模式匹配。

re 模块也提供了与这些方法功能完全一致的函数&＃xff0c;这些函数使用一个模式字符串做为它们的第一个参数。

re.match函数

re.match 尝试从字符串的起始位置匹配一个模式&＃xff0c;如果不是起始位置匹配成功的话&＃xff0c;match()就返回none。

函数语法&＃xff1a;

re.match(pattern, string, flags&＃61;0)

函数参数说明&＃xff1a;

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位&＃xff0c;用于控制正则表达式的匹配方式&＃xff0c;如&＃xff1a;是否区分大小写&＃xff0c;多行匹配等等。

匹配成功re.match方法返回一个匹配的对象&＃xff0c;否则返回None。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

匹配对象方法	描述
group(num&＃61;0)	匹配的整个表达式的字符串&＃xff0c;group() 可以一次输入多个组号&＃xff0c;在这种情况下它将返回一个包含那些组所对应值的元组。
groups()	返回一个包含所有小组字符串的元组&＃xff0c;从 1 到所含的小组号。

实例&＃xff1a;

import re line &＃61; "I really like you yesterday" matchObj &＃61; re.match( r&＃39;(.*) really (.*?) .*&＃39;, line)

print ("matchObj.group() : ", matchObj.group())

print ("matchObj.group(1) : ", matchObj.group(1))

print ("matchObj.group(2) : ", matchObj.group(2))

以上实例执行结果如下&＃xff1a;

matchObj.group() : I really like you yesterdaymatchObj.group(1) : ImatchObj.group(2) : like

re.search方法

re.search 会在字符串内查找模式匹配&＃xff0c;直到找到第一个匹配。

函数语法&＃xff1a;

re.search(pattern, string, flags&＃61;0)

函数参数说明&＃xff1a;

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位&＃xff0c;用于控制正则表达式的匹配方式&＃xff0c;如&＃xff1a;是否区分大小写&＃xff0c;多行匹配等等。

匹配成功re.search方法返回一个匹配的对象&＃xff0c;否则返回None。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

匹配对象方法	描述
group(num&＃61;0)	匹配的整个表达式的字符串&＃xff0c;group() 可以一次输入多个组号&＃xff0c;在这种情况下它将返回一个包含那些组所对应值的元组。
groups()	返回一个包含所有小组字符串的元组&＃xff0c;从 1 到所含的小组号。

实例&＃xff1a;

#!/usr/bin/pythonimport re line &＃61; "I really like you yesterday"; searchObj &＃61; re.search(r&＃39;(.*) really (.*?) .*&＃39;, line)print ("searchObj.group() : ", searchObj.group())print ("searchObj.group(1) : ", searchObj.group(1))print ("searchObj.group(2) : ", searchObj.group(2))

以上实例执行结果如下&＃xff1a;

searchObj.group() : I really like you yesterday searchObj.group(1) : I searchObj.group(2) : love

re.match与re.search的区别

re.match只匹配字符串的开始&＃xff0c;如果字符串开始不符合正则表达式&＃xff0c;则匹配失败&＃xff0c;函数返回None&＃xff1b;而re.search匹配整个字符串&＃xff0c;直到找到一个匹配。

实例&＃xff1a;

#!/usr/bin/pythonline &＃61;

以上实例运行结果如下&＃xff1a;

No match!! search --> matchObj.group() : love

检索和替换

Python 的re模块提供了re.sub用于替换字符串中的匹配项。

语法&＃xff1a;

re.sub(pattern, repl, string, max&＃61;0)

返回的字符串是在字符串中用 RE 最左边不重复的匹配来替换。如果模式没有发现&＃xff0c;字符将被没有改变地返回。

可选参数 count 是模式匹配后替换的最大次数&＃xff1b;count 必须是非负整数。缺省值是 0 表示替换所有的匹配。

实例&＃xff1a;

import re phone &＃61; "2004-959-559 # 这是一个国外电话号码" # 删除字符串中的 Python注释 num &＃61; re.sub(r&＃39;#.*$&＃39;, "", phone) print("电话号码是: ", num) # 删除非数字(-)的字符串 num &＃61; re.sub(r&＃39;\D&＃39;, "", phone) print("电话号码是 : ", num)

以上实例执行结果如下&＃xff1a;

电话号码 : 2004-959-559 电话号码 : 2004959559

repl 参数是一个函数

以下实例中将字符串中的匹配的数字乘以 2&＃xff1a;

实例&＃xff1a;

import re # 将匹配的数字乘以 2 def double(matched): value &＃61; int(matched.group(&＃39;value&＃39;)) return str(value * 2) s &＃61; &＃39;A23G4HFD567&＃39; print(re.sub(&＃39;(?P\d&＃43;)&＃39;, double, s))

执行输出结果为&＃xff1a;

A46G8HFD1134

re.compile 函数

compile 函数用于编译正则表达式&＃xff0c;生成一个正则表达式( Pattern )对象&＃xff0c;供 match() 和 search() 这两个函数使用。

语法格式为&＃xff1a;

re.compile(pattern[, flags])

参数&＃xff1a;

pattern : 一个字符串形式的正则表达式
flags : 可选&＃xff0c;表示匹配模式&＃xff0c;比如忽略大小写&＃xff0c;多行模式等&＃xff0c;具体参数为&＃xff1a;

re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性&＃xff0c;忽略空格和 # 后面的注释

实例

>>>import re >>> pattern &＃61; re.compile(r&＃39;\d&＃43;&＃39;) # 用于匹配至少一个数字 >>> m &＃61; pattern.match(&＃39;one12twothree34four&＃39;) # 查找头部&＃xff0c;没有匹配 >>> print (m) None >>> m &＃61; pattern.match(&＃39;one12twothree34four&＃39;, 2, 10) # 从&＃39;e&＃39;的位置开始匹配&＃xff0c;没有匹配 >>> print (m) None >>> m &＃61; pattern.match(&＃39;one12twothree34four&＃39;, 3, 10) # 从&＃39;1&＃39;的位置开始匹配&＃xff0c;正好匹配 >>> print (m) # 返回一个 Match 对象 <_sre.sre_match object at>0x10a42aac0>>>> m.group(0) # 可省略 0&＃39;12&＃39;>>> m.start(0) # 可省略 03>>> m.end(0) # 可省略 05>>> m.span(0) # 可省略 0 (3, 5)

在上面&＃xff0c;当匹配成功时返回一个 Match 对象&＃xff0c;其中&＃xff1a;

group([group1, …]) 方法用于获得一个或多个分组匹配的字符串&＃xff0c;当要获得整个匹配的子串时&＃xff0c;可直接使用 group() 或 group(0)&＃xff1b;
start([group]) 方法用于获取分组匹配的子串在整个字符串中的起始位置(子串第一个字符的索引)&＃xff0c;参数默认值为 0&＃xff1b;
end([group]) 方法用于获取分组匹配的子串在整个字符串中的结束位置(子串最后一个字符的索引&＃43;1)&＃xff0c;参数默认值为 0&＃xff1b;
span([group]) 方法返回 (start(group), end(group))。

再看看一个例子&＃xff1a;

>>>import re >>> pattern &＃61; re.compile(r&＃39;([a-z]&＃43;) ([a-z]&＃43;)&＃39;, re.I) # re.I 表示忽略大小写 >>> m &＃61; pattern.match(&＃39;Hello World Wide Web&＃39;) >>> print (m) # 匹配成功&＃xff0c;返回一个 Match 对象 <_sre.sre_match object at>0x10bea83e8>>>> m.group(0) # 返回匹配成功的整个子串&＃39;Hello World&＃39;>>> m.span(0) # 返回匹配成功的整个子串的索引 (0, 11)>>> m.group(1) # 返回第一个分组匹配成功的子串&＃39;Hello&＃39;>>> m.span(1) # 返回第一个分组匹配成功的子串的索引 (0, 5)>>> m.group(2) # 返回第二个分组匹配成功的子串&＃39;World&＃39;>>> m.span(2) # 返回第二个分组匹配成功的子串 (6, 11)>>> m.groups() # 等价于 (m.group(1), m.group(2), ...) (&＃39;Hello&＃39;, &＃39;World&＃39;)>>> m.group(3) # 不存在第三个分组 Traceback (most recent call last): File "", line 1, in IndexError: no such group

findall

在字符串中找到正则表达式所匹配的所有子串&＃xff0c;并返回一个列表&＃xff0c;如果没有找到匹配的&＃xff0c;则返回空列表。

注意&＃xff1a;match 和 search 是匹配一次 findall 匹配所有。

语法格式为&＃xff1a;

findall(string[, pos[, endpos]])

参数&＃xff1a;

string : 待匹配的字符串。
pos : 可选参数&＃xff0c;指定字符串的起始位置&＃xff0c;默认为 0。
endpos : 可选参数&＃xff0c;指定字符串的结束位置&＃xff0c;默认为字符串的长度。

查找字符串中的所有数字&＃xff1a;

import re pattern &＃61; re.compile(r&＃39;\d&＃43;&＃39;) # 查找数字 result1 &＃61; pattern.findall(&＃39;school 123 google 456&＃39;) result2 &＃61; pattern.findall(&＃39;sch88ool123google456&＃39;, 0, 10)print(result1) print(result2)

输出结果&＃xff1a;

[&＃39;123&＃39;, &＃39;456&＃39;] [&＃39;88&＃39;, &＃39;12&＃39;]

re.finditer

和 findall 类似&＃xff0c;在字符串中找到正则表达式所匹配的所有子串&＃xff0c;并把它们作为一个迭代器返回。

re.finditer(pattern, string, flags&＃61;0)

参数&＃xff1a;

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位&＃xff0c;用于控制正则表达式的匹配方式&＃xff0c;如&＃xff1a;是否区分大小写&＃xff0c;多行匹配等等。

实例&＃xff1a;

import re it &＃61; re.finditer(r"\d&＃43;","12a32bc43jf3") for match in it: print (match.group() )

输出结果&＃xff1a;

12 32 43 3

re.split

split 方法按照能够匹配的子串将字符串分割后返回列表&＃xff0c;它的使用形式如下&＃xff1a;

re.split(pattern, string[, maxsplit&＃61;0, flags&＃61;0])

参数&＃xff1a;

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
maxsplit	分隔次数&＃xff0c;maxsplit&＃61;1 分隔一次&＃xff0c;默认为 0&＃xff0c;不限制次数。
flags	标志位&＃xff0c;用于控制正则表达式的匹配方式&＃xff0c;如&＃xff1a;是否区分大小写&＃xff0c;多行匹配等等。

实例&＃xff1a;

>>>import re >>> re.split(&＃39;\W&＃43;&＃39;, &＃39;school, school, chool.&＃39;) [&＃39;runoob&＃39;, &＃39;runoob&＃39;, &＃39;w3cschool&＃39;, &＃39;&＃39;] >>> re.split(&＃39;(\W&＃43;)&＃39;, &＃39; school, school, school.&＃39;) [&＃39;&＃39;, &＃39; &＃39;, &＃39;runoob&＃39;, &＃39;, &＃39;, &＃39;school&＃39;, &＃39;, &＃39;, &＃39;school&＃39;, &＃39;.&＃39;, &＃39;&＃39;] >>> re.split(&＃39;\W&＃43;&＃39;, &＃39; w3cschool, w3cschool, w3cschool.&＃39;, 1) [&＃39;&＃39;, &＃39;school, school, school.&＃39;] >>> re.split(&＃39;a*&＃39;, &＃39;hello world&＃39;) # 对于一个找不到匹配的字符串而言&＃xff0c;split 不会对其作出分割 [&＃39;hello world&＃39;]请看下面一篇

岁月有你&＃xff0c;惜惜相处

扫码关注我们

在看的&＃xff0c;麻烦点一下再走好吗

推荐阅读

int
Python爬虫中使用正则表达式的方法和注意事项

本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤，并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法，包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块，并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习，读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]

蜡笔小新 2023-12-12 11:51:07
int
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
int
正则表达式_re模块的使用方法详解

本文详细介绍了Python中正则表达式和re模块的使用方法。首先解释了转义符的作用，以及如何在字符串中包含特殊字符。然后介绍了re模块的功能和常用方法。通过学习本文，读者可以掌握正则表达式的基本概念和使用技巧，进一步提高Python编程能力。 ... [详细]

蜡笔小新 2023-12-10 19:04:04
int
正则表达式及其范例

为什么80%的码农都做不了架构师？一、前言部分控制台输入的字符串，编译成java字符串之后才送进内存，比如控制台打\， ... [详细]

蜡笔小新 2023-10-17 20:18:36
int
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12
int
lua语言闭包、模式匹配、日期、编译、模块的特性及应用

本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值，函数可以作为变量自由传递，也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性，为程序开发带来了便利。 ... [详细]

蜡笔小新 2023-12-14 18:18:21
int
PHP图片截取方法及应用实例

本文介绍了使用PHP动态切割JPEG图片的方法，并提供了应用实例，包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用，以及图片切割的具体步骤。同时，还提供了一些注意事项和优化建议。通过本文的学习，读者可以掌握PHP图片截取的技巧，实现自己的需求。 ... [详细]

蜡笔小新 2023-12-14 16:44:09
int
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
int
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
int
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
int
java drools5_Java Drools5.1 规则流基础【示例】（中）

五、规则文件及规则流EduInfoRule.drl:packagemyrules;importsample.Employ;ruleBachelorruleflow-group ... [详细]

蜡笔小新 2023-12-10 15:01:31
int
MySQL多表数据库操作方法及子查询详解

本文详细介绍了MySQL数据库的多表操作方法，包括增删改和单表查询，同时还解释了子查询的概念和用法。文章通过示例和步骤说明了如何进行数据的插入、删除和更新操作，以及如何执行单表查询和使用聚合函数进行统计。对于需要对MySQL数据库进行操作的读者来说，本文是一个非常实用的参考资料。 ... [详细]

蜡笔小新 2023-12-09 22:17:43
数组
Java实现大数乘法（分治算法）

本文介绍了使用Java实现大数乘法的分治算法，包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]

蜡笔小新 2023-12-14 15:43:50
int
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
数组
如何用UE4制作2D游戏文档——计算篇

篇首语：本文由编程笔记#小编为大家整理，主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 09:50:34

achih

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章