电话号码正则表达式语法（python正则表达式详解）

仰望辉煌。　　 • 2022年3月16日上午2:12 • 创业分享

通过前面的学习，我们知道了调用Requests库可以爬取HTML页面，调用Beautiful Soup库可以解析HTML页面。但是通常一个HTML页面拥有非常多的信息，你总不能全部拿过来再手动修改吧，所以就需要使用Re正则表达式来提取页面的关键信息。

正则表达式是什么？

Re：Regular expression，可以简洁、优雅的表达一组字符串的表达式。

举个例子：

"Py"
"Pyt"
"Pyth"
"Pytho"
"Python"

以上这组字符串有什么相似之处呢？没错，就是它们都是以”Py”开头的。

我们用了五行才把所有的字符串枚举一遍，如果换成使用Re呢？一行OK！

Py(t|th|tho|thon)?N

这只是五行字符串，如果是成千上万行呢？那正则表达式用起来岂不是特别的爽。

“一行胜千言” — 正则表达式

正则表达式最最本质的特征就是：简洁、优雅、一行胜千言。

在我看来，就像是跟苹果LOGO似的，极简之美环绕其周。

还有一个词：求同存异。

下面来看看正则表达式的语法：

正如上面所展示的，正则表达式由字符和操作符构成。

常用操作符

来看一些经典的正则表达式例子：

^[A-Za-z]+$ 由26个字母组成的字符串
^-?d+$ 整数形式的字符串
[1-9]d{5} 中国境内邮政编码
d{3}-d{8}|d{4}-d{7} 国内电话号码

Python中的Re库

Python为正则表达式提供了标准库Re，用于匹配字符串。

调用Re库：

import re

正则表达式的表示类型：

Re库采用raw string类型表示正则表达式，形式为：r’text’。

例如：r'[1-9]d[5]’

raw string 类型是原生字符串类型，不能对转义字符进行再次转义。

Re库还可以采用string类型表示正则表达式，更为繁琐，形式为’text’。

例如：'[1-9]\d{5}’

前一个”是转义字符。

当正则表达式包含转义字符时，更推荐使用raw string类型。

Re库的基本方法：

先来介绍一下Match对象：

Match对象是一次匹配的结果，包含很多的匹配信息。

和response对象一样，Match对象也有一些属性和方法。

Match对象的属性

Match对象的方法

前面已经介绍过如何调用对象的属性和方法了，这里就不再赘述，可以百度做深入了解。

Re库的六个基本方法

下面着重讲解一下search方法：

re.search(pattern, string, flags=0)

在一个字符串中搜索匹配正则表达式的第一个位置，返回Match对象。

pattern：正则表达式的字符串或者原生字符串表示
string：带匹配的字符串
flags：正则表达式使用时的控制标记

flags标记取值

# 使用search方法匹配字符串
match = re.search(r'[1-9]d{5}', 'A100001', flags=re.I)
# 匹配成功则返回匹配后的字符串
if match:
    print(match.group(0))

注意：Match对象返回匹配结果，所以说Match返回值是bool型变量，故用条件语句判断。

Re库的方法使用起来并没有太大的难度，下面给出剩余方法总结:

re.match(pattern, string, flags=0)

从一个字符串的开始位置起匹配正则表达式，返回Match对象。

参数同上。

re.findall(pattern, string, flags=0)

搜索字符串，以列表类型返回全部能匹配的子串。

参数同上。

re.split(pattern, string, maxsplit=0, flags=0)

将一个字符串按照正则表达式匹配结果进行分割，返回列表类型。

maxsplit：最大分割数，剩余部分作为最后一个元素输出

re.finditer(pattern, string, flags=0)

搜索字符串，返回一个匹配结果的迭代类型，每个迭代元素都是Match对象。

参数同上。

for m in re.finditer(r'[1-9]d{5}', 'A100001 B100002'):
    if m:
        print(m.group(0))

re.sub(pattern, repl, string, count=0, flags=0)

在一个字符串中替换所有匹配正则表达式的子串，返回替换后的字符串。

repl：替换匹配字符串的字符串
count：匹配的最大替换次数

sub = re.sub(r'[1-9]d{5}', ',hello', 'A100001 B100002')
print(sub)

Re库的等价用法

上面讲解了Re库六种基本方法的函数式用法，下面介绍另一种等价的面向对象的用法：

match = re.search(r'[1-9]d{5}', 'A100001')

cmp = re.compile(r'[1-9]d{5}')
match = cmp.search('A100001')

第一种是函数式用法，一次操作可以完成任务；第二种是面向对象用法，先将正则表达式的字符串形式编译成正则表达式对象，再进行方法操作。两种方法都是可以的，了解即可。

Re库的贪婪匹配机制

在实际使用过程中，我们会遇上一个问题，如下：

match = re.search(r'PY.*N', 'PYANBNCN')

对这样一个字符串，原则上是可以返回三个子串，即’PYAN’,’PYANBN’,’PYANBNCN’。但是我们调用match.group(0)查看时，该返回哪一个呢？

Re库默认采用贪婪匹配机制，返回匹配中最长的子串，也就是返回’PYANBNCN’了。

那又有一个问题了，当我们想要输出最短的子串该怎么办呢？？

我们只需在操作符后面添加？即可输出最小匹配了：

最小匹配

match = re.search(r'PY.*?N', 'PYANBNCN')
if match:
    print(match.group(0))

小结

本章讲解了Python中正则表达式Re库的入门级使用，正则表达式并不是Python所独有的，很多地方都可以使用，在学习完Re库后对其他语言和任务也都有一定的帮助。

仰望辉煌。　　

0 0

简约商业思维“十二字原则”

文 / 徐井宏，简约商业思维创建者，中关村龙门投资董事长，清华大学教授来源：企业家杂志我们正在经历第四次工业革命，科学技术的发展、经济形态的演化、世界格局的走向等都瞬息万变。面对当前不确定性和复杂性的时代特征，企业家要善于在不确定中建立确

小多多
创业分享 2023年3月28日
去细纹眼霜排行榜10强，从平价到贵妇的十款眼霜集结

女人容颜开始走下坡路之后，首当其冲的就是眼睛，因为眼部的肌肤最为脆弱，一旦眼周开始出现干燥、黑眼圈、细纹等不良状态就会使整个人看起来十分的衰老。那么眼霜什么牌子好呢？下面就跟着小编…

仰望辉煌。　　
2022年3月15日 • 创业分享
苹果台式机型号大全（苹果笔记本全系列型号）

多年来，Windows 和 macOS，这两个操作系统经过不断的更新优化，给用户带来了良好的操作体验。但对于许多人来说，尤其是苹果用户，由于苹果生态系统的深度整合，大多数人似乎更…

仰望辉煌。　　
2022年3月16日 • 创业分享
苹果虚拟home键在哪里设置（home虚拟键设置技巧）

iPhone虚拟Home键又叫小白点，它是为保护实体Home键而设的虚拟按键，具有手势、主屏幕、屏幕快照和多任务等功能。iPhone6s怎么打开小白点？iOS9小白点怎么用？iPh…

仰望辉煌。　　
2022年3月15日 • 创业分享
创意字体设计生成器（花式文字在线制作器）

设计师在做设计的时候，最缺的就是灵感了。每次的灵感也就那么一瞬间，但是工作量多了，灵感慢慢地也就枯竭了。 300套最新创意字体设计模板粉丝免费领： 1、评论区吱一声就好 2、私信我…

仰望辉煌。　　
2022年3月15日 • 创业分享
苹果8运行内存多大（苹果8运行内存大小介绍）

【手机中国新闻】不久前传闻苹果将于9月12日发布新iPhone，随后新机将从9月15日开始接受预定，9月22日上市。而在发布之前，凯基证券分析师郭明池透露了有关新iPhone的消…

仰望辉煌。　　
创业分享 2022年3月16日
后端php能干什么（java和php发展前景）

为什么要学习PHP？“我可以用JavaScript来实现程序编写。”但JavaScript的能力是有限的，JavaScript通常运行在浏览器（客户端），它可以制作网页上面的特效：…

小多多
创业分享 2021年10月19日
海尔冰箱温度多少合适（冰箱温度最佳调节方法）

海尔是中国最著名的品牌之一，现在在消费者眼中，它也是高品质产品的代表，在世界范围内都有着极高的知名度和巨大的影响力，海尔各类产品的市场占有率都颇高，其中的海尔冰箱也是畅销产品之一。…

仰望辉煌。　　
创业分享 2022年3月15日
世界上最好的车是什么车，世界十大名车排行榜

1.劳斯莱斯(Rolls-Royce) 劳斯莱斯(Rolls-Royce)是世界顶级豪华轿车，以豪华而享誉全球。除了制造汽车，劳斯莱斯还涉足飞机发动机制造领域，它也是世界上最优秀的…

时间不会说谎　　
2022年3月13日 • 创业分享
2021年中国电商行业分析报告（浅谈电商行业发展前景）

经过三十多年的发展，中国票据市场快速发展，市场规模达到百万亿级。随着中国实体经济恢复向好，金融活动将会更加活跃，商票融资方式逐步多样化，为电子商票的发展提供了机遇。2009年以来，…

仰望辉煌。　　
2022年3月16日 • 创业分享
如何购买股票(怎么才能收益更好)

接着昨天的话题说如何买股票，才能有更好的收益呢？首先，我们来看看，为什么买了房子能赚钱 1.选对了趋势。只要进入这个大趋势，前20年里，基本上入场就能赚钱。只是赚钱多少不一样。…

嗑学家
创业分享 2021年11月6日
怎么申请2个微信号，方法超简单一学就会

现在很多手机已经自带微信分身的功能，可以用一个手机同时登陆两个微信号。但受到腾讯限制，一般情况下一个手机号是只可以注册一个微信号。通过尝试和查询笔者也学会了如何用一个手机号注册两个…

仰望辉煌。　　
2022年3月15日 • 创业分享
创业分享

互联网营销模式有哪几种，四种常见的营销模式介绍

前段时间网上疯传摘自本人关于传统企业互联网转型落地攻略《互联网思维2.0：传统企业互联网转型》中的一篇文章《“互联网+”企业：六大商业模式》，文中提到了“互联网+”企业四大落地系统…

仰望辉煌。　　
2022年3月15日
为什么说思维决定人生？想获得进步，你需要培养正确的思维模式

从心理学的角度来说，思维跟我们的情绪和行为息息相关。一件事，我们站在什么样的角度去看待，我们就会得出什么样的情绪和行为选择。然而，很多人并不知道自己的思维模式，到底是处于一种什么样的状态。当他们顺应不好的思维去面对人生的各种问题时，他们做出

小多多
2023年4月23日 • 创业分享
无人便利店加盟费是多少，便利店加盟十大品牌介绍

2017年下半年以来，“新零售”这个概念，被炒得火热。别说你对此浑然不知！当然，你成天忙于你单位的工作，那就不能怪你了，你是职场达人。那么，什么才是新零售呢？我们个人，有没有啥…

仰望辉煌。　　
2022年3月16日 • 创业分享

发表回复

登录后才能评论

电话号码正则表达式语法（python正则表达式详解）

正则表达式是什么？

“一行胜千言” — 正则表达式

Python中的Re库

Re库的等价用法

Re库的贪婪匹配机制

小结

相关推荐

发表回复