`
younglibin
  • 浏览: 1195946 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

常用正则表达式模式收集(二)

阅读更多
•提取网页中的链接地址
(http:\/\/\[^" ']+)
href *= *['"]*(\S+)["']* *
((http|https|ftp):(\/\/|\\\\)((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3})(((\/[\~]*|\\[\~]*)(\w)+)|[.](\w)+)*(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*) "精确匹配"

•匹配一个 HTML 标记
<(.*)>.*<\/\1>  "第一个匹配的是(.*),后面的\1就引用他,所以就成了对称的"
<[^>]*>      "html标记"

•从一段HTML代码中搜索其中的图片
/\/ig,"$1"

•匹配连续字符
(.)\1   匹配两个连续相同的字符,(.)\1第一个匹配的是(.),后面的\1就引用他,连起来就成了两个连续的
(.)\1\1  匹配三个连续相同的字符,如果三个连续就用(.)\1\1,后面两个\1都引用前面的(.)

•替换"[abc]asdfasldkfjlasd[/abc]中的[abc]"
(/(^\[abc\])|(\[\/abc\]$)/gi,'')

•年月日的格式
/^(\d{4})-(\d{1,2})-(\d{1,2})$/ "yyyy-mm-dd"
/^(\d{4})/(\d{1,2})/(\d{1,2})$/ "yyyy/mm/dd"
(^[[igit:]]{4}-([1-9]|1[0-2])-([1-9]|[1-2][0-9]|3[0-1]))
(/^\d{4}-([1-9]|1[0-2])-([0-2]{0,1}[0-9]|3[0-1])$/g)

•Email邮件的格式
/^\w+((-\w+)|(\.\w+))*\@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/
/^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)$/
/\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*/
/(\w)+[@]{1}(\w)+[.]{1,3}(\w)+/

•身份证
/([0-9]){15}/ "15位数字"
/^\d+$/ "全数字"
/^(\d{14}|\d{17})(\d|x)$/ "15位或18位"

•手机电话号码
/^13[13567890](\d{8})$/      "13开头,第三位为1,3,5,6,7,8,9,0,后跟8个数字"
/^(\d{3,4}-){0,1}(\d{7,8})$/   "匹配3-4位区号和横杆,7-8位市内电话号码"
/^\d{3,4}-\d{7,8}(-\d{3,4})?$/  "区号必填为3-4位的数字,区号之后用“-”与电话号码连接;电话号码为7-8位的数字;分机号码为3-4位的数字,非必填,但若填写则以“-”与电话号码相连接"

.匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)
匹配Email地址的正则表达式:\w ([- .]\w )*@\w ([-.]\w )*\.\w ([-.]\w )*
匹配网址URL的正则表达式:http://([\w-] \.) [\w-] (/[\w- ./?%&=]*)?

.Email : /^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/,
Phone : /^((\(\d{2,3}\))|(\d{3}\-))?(\(0\d{2,3}\)|0\d{2,3}-)?[1-9]\d{6,7}(\-\d{1,4})?$/,
Mobile : /^((\(\d{2,3}\))|(\d{3}\-))?13\d{9}$/,
Url : /^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$/,
Currency : /^\d+(\.\d+)?$/,
Number : /^\d+$/,
Zip : /^[1-9]\d{5}$/,
QQ : /^[1-9]\d{4,8}$/,
Integer : /^[-\+]?\d+$/,
Double : /^[-\+]?\d+(\.\d+)?$/,
English : /^[A-Za-z]+$/,
Chinese : /^[\u0391-\uFFE5]+$/,

.
匹配中文字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:ns*r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:< (S*?)[^>]*>.*?|< .*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^s*|s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
匹配国内电话号码:d{3}-d{8}|d{4}-d{7}
评注:匹配形式如 0511-4405222 或 021-87888822
匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始
匹配中国邮政编码:[1-9]d{5}(?!d)
评注:中国邮政编码为6位数字
匹配身份证:d{15}|d{18}
评注:中国的身份证为15位或18位
匹配ip地址:d+.d+.d+.d+
评注:提取ip地址时有用
匹配特定数字:
^[1-9]d*$    //匹配正整数
^-[1-9]d*$   //匹配负整数
^-?[1-9]d*$   //匹配整数
^[1-9]d*|0$  //匹配非负整数(正整数 + 0)
^-[1-9]d*|0$   //匹配非正整数(负整数 + 0)
^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正
匹配特定字符串:
^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:
只能输入数字:“^[0-9]*$”
只能输入n位的数字:“^d{n}$”
只能输入至少n位数字:“^d{n,}$”
只能输入m-n位的数字:“^d{m,n}$”
只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”
只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$”
只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$”
只能输入非零的正整数:“^+?[1-9][0-9]*$”
只能输入非零的负整数:“^-[1-9][0-9]*$”
只能输入长度为3的字符:“^.{3}$”
只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$”
只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”
只能输入由26个小写英文字母组成的字符串:“^[a-z]+$”
只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”
只能输入由数字、26个英文字母或者下划线组成的字符串:“^w+$”
验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度在6-18之间,
只能包含字符、数字和下划线。
验证是否含有^%&’,;=?$”等字符:“[^%&',;=?$x22]+”
只能输入汉字:“^[u4e00-u9fa5],{0,}$”
验证Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
验证电话号码:“^((d{3,4})|d{3,4}-)?d{7,8}$”
正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
验证身份证号(15位或18位数字):“^d{15}|d{}18$”
验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正确格式为:“01”“09”和“1”“31”。
匹配中文字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
匹配空行的正则表达式:n[s| ]*r
匹配HTML标记的正则表达式:/< (.*)>.*|< (.*) />/
匹配首尾空格的正则表达式:(^s*)|(s*$)
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

分享到:
评论

相关推荐

    正则表达式大全 正则表达式 模式匹配 Javascript

    关键字:正则表达式 模式...摘要:收集一些常用的正则表达式。 正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。

    精通正则表达式~~~

    精通正则表达式第三版 搜集于网络 前言..........I 第1章:正则表达式入门.... 1 解决实际问题... 2 作为编程语言的正则表达式... 4 以文件名做类比... 4 以语言做类比... 5 正则表达式的知识框架... 6 对于...

    正则表达式

    在正则表达式中,括号的第二个用途是在完整的模式中定义子模式。当一个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配 的部分.例如,假定我们正在检索的模式是一个或多个字母后面...

    常用证件号码的正则表达式大全(收集整理)

    在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。...

    日常收集整理php正则表达式(超常用)

    以下是关于小编给大家日常收集整理php正则表达式,具体内容请看下文详解吧 $str = preg_replace("/()/", '\1&lt;span&gt;\2&lt;/span&gt;\3', $str); 其中用了三个子模式(每个圆括号中内容为一个子模式),第一个是链接开始...

    最常用的PHP正则表达式收集整理

    其中用了三个子模式(每个圆括号中内容为一个子模式),第一个是链接开始标签,第二个是链接文本,第三个是&lt;/a&gt; 然后第二个参数中\1、\2、\3就表示这三个部分,要替换成什么样子还不简单? 获取页面中的所有链接...

    PilotEdit Lite v12.7.0.zip

    可以把常用的正则表达式定义在脚本中,直接运行脚本即可替换文字 14. 256位 AES加密/解密 用PilotEdit直接透明地编辑一个加密的文件 加密/解密多个文件和目录 加密/解密超过4G的文件 15. 文件组 双击文件组...

    PilotEdit支持超过400G的文件编辑

     &gt;可以把常用的正则表达式定义在脚本中,直接运行脚本即可替换文字  14、256位 AES加密/解密  &gt;用PilotEdit直接透明地编辑一个加密的文件  &gt;加密/解密多个文件和目录  &gt;加密/解密超过4G的文件  15、文件...

    功能超级强悍的文本编辑器 PilotEdit 14.3.0 + x64 中文多语免费版.zip

    文本编辑器,支持文本编辑,比较,FTP编辑,FTP上传下载,加密,十六进制编辑,列模式,回行显示,正则表达式,多行查找和替换,代码折叠,关键字高亮显示,编辑400GB的大文件,比较100GB的大文件,对超过1G的大文件...

    大家说的Python爬虫是指什么?学会Python爬虫需要了解的五大方面.docx

    3. **正则表达式**:掌握正则表达式的基本语法和用法,这是爬虫中常用的一种模式匹配工具。爬虫需要从网页中提取数据,而正则表达式可以帮助我们更快速地提取所需信息。 4. **网络爬虫原理**:了解HTTP协议和网页...

    自己收集整理的一些常用的工具类

    RegexUtils 正则表达式工具类,提供一些常用的正则表达式 SDCardUtils SD卡工具箱 Symbols 常用符号 WebViewManager WebView管理器,提供常用设置 原地址:https://github.com/l123456789jy/Lazy

    全能字符串批量替换机7.0

    替换、查找既可使用简单表达式进行匹配,也可使用正则表达式进行匹配;正则表达式能够处理特别复杂的匹配;除了文本文件,甚至还支持在office文档中替换和查找;可以说,本软件在类似软件中,功能的独特和强大达到了...

    在会计研究中使用 Python 进行文本分析-研究论文

    我们首先介绍正则表达式,这是一种用于在文本中查找模式的复杂语言。 然后我们将展示如何使用正则表达式从文本中提取特定部分。 接下来,我们介绍将文本数据(非结构化数据)转换为表示感兴趣变量(结构化数据)的...

    基于MVP模式开发的带缓存网络爬虫,采用最流行框架搭建,干货多多.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    爬虫学习中,结合数据库,利用异步多进程的生产者消费者模式的的一个k站爬虫(bushi).zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    简单版的小学算数出题器,本程序的特点有:JavaFX实现可视化界面、设计模式、方便扩展功能等。.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    小说精品屋.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    leetcode中国-AlphaGooo-php:个人php开发技术累积,不定期更新

    leetcode中国 ...- ...- 编程处理异常抛出,防止程序被中断 - 借助扩展读写excel - 对于一些输入或者输出的字符,防止其...正则表达式学习 其他网站(Other Websites) - 一个开源软件安全社区 - 一个web 安全社区 - 语义化版

    Python核心编程第二版(ok)

    Python核心编程第二版(ok) 第1部分 Python核心  第1章 欢迎来到Python世界   1.1 什么是Python   1.2 起源   1.3 特点   1.3.1 高级   1.3.2 面向对象   1.3.3 可升级   1.3.4 可扩展   ...

    Python核心编程第二版

     5.5.1 混合模式操作符   5.5.2 标准类型操作符   5.5.3 算术操作符   5.5.4 *位操作符(只适用于整型)   5.6 内建函数与工厂函数   5.6.1 标准类型函数   5.6.2 数字类型函数   5.6.3 仅...

Global site tag (gtag.js) - Google Analytics