正则表达式学习笔记贪婪、惰性和支配量词

immortal2512

浏览: 44082 次
性别:
来自: 上海

最近访客更多访客>>

nigegeswo

qiangshao

dbsoft

yanfeijun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

正则表达式

正则表达式工作 C C++C#

贪婪量词：

　　先看整个字符串是不是一个匹配。如果没有发现匹配，它去掉最后字符串中的最后一个字符，并再次尝试。如果还是没有发现匹配，那么再次去掉最后一个字符串，这个过程会一直重复直到发现一个匹配或者字符串不剩任何字符。简单量词都是贪婪量词。

　　惰性量词：

　　先看字符串中的第一个字母是不是一个匹配，如果单独着一个字符还不够，就读入下一个字符，组成两个字符的字符串。如果还没有发现匹配，惰性量词继续从字符串中添加字符直到发现一个匹配或者整个字符串都检查过也没有匹配。惰性量词和贪婪量词的工作方式恰好相反。

　　支配量词：

　　只尝试匹配整个字符串。如果整个字符串不能产生匹配，不做进一步尝试。

　　贪婪量词惰性量词支配量词描述

　　-------------------------------------------------------------------------------------

　　? ?? ?+ 可以出现0次或1次，但至多出现1次

　　* *? *+ 可以出现任意次，也可以不出现

　　+ +? ++ 出现1次或多次，但至少出现1次

　　{n} {n}? {n}+ 一定出现n次

　　{n,m} {n,m}? {n,m}+ 至少出现n次，但至多不能超过m次

　　{n,} {n,}? {n,}+ 可以出现任意次，但至少出现n次

　　例如：我们要从字符串abbbaabbbaaabbb1234中获得abbb，aabbb，aaabbb的匹配

　　1、贪婪量词

　　1 var regexp = /.*bbb/g;

　　2 var a = str.match(regexp);

　　3 alert(a.length); //output:1

　　4 alert(a[0]); //output:abbbaabbbaaabbb

　　贪婪量词的工作过程可以这样表示：

　　a)abbbaabbbaaabbb1234

　　b)abbbaabbbaaabbb123

　　c)abbbaabbbaaabbb12

　　d)abbbaabbbaaabbb1

　　e)abbbaabbbaaabbb //true

　　可以看到，贪婪量词在取得一次匹配后就会停止工作，虽然我们加了’g’(全局匹配)

　　2、惰性量词

　　1 var regexp = /.*?bbb/g;

　　2 var a = str.match(regexp);

　　3 alert(a.length); //output:3

　　4 alert(a[0]); //output:abbb

　　5 alert(a[1]); //output:aabbb

　　6 alert(a[2]); //output:aaabbb

　　惰性量词的工作过程可以这样表示：

　　a)a

　　b)ab

　　c)abb

　　d)abbb //保存结果，并从下一个位置重新开始

　　e)a

　　f)aa

　　g)aab

　　h)aabb

　　j)aabbb //保存结果，并从下一个位置重新开始

　　e)a

　　e)aa

　　e)aaa

　　e)aaab

　　e)aaabb

　　e)aaabbb //保存结果，并从下一个位置重新开始

　　由于JS是不支持支配量词的，所以支配量词我们只能用JAVA来演示：

　　1 String string = "abbbaabbbaaabbb1234";

　　2 Pattern p = Pattern.compile(".*+bbb");

　　3 Matcher m = p.matcher(string);

　　4 System.out.println(m.find()); //output:false

　　因为支配量词采用一刀切的匹配方式，如：

　　a)abbbaabbbaaabbb1234 //false

分享到：

oracle以分隔符来循环字符串 | javascript保留N位小数

2010-03-23 14:25
浏览 878
评论(0)
分类:Web前端
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论