课程咨询 :13623629309

太原PHP培训 > 达内新闻 > 最通俗易懂的php正则表达式教程(上)
  • 最通俗易懂的php正则表达式教程(上)

    发布:资源共享      来源:资源共享      时间:2016-10-17

  • 最通俗易懂的php正则表达式教程(上)

    今天太原php培训班为大家带来一些福利,希望对大家有所帮助。

    基础知识

    字符集

    POSIX 扩展正则表达式函数

    Perl 兼容正则表达式函数

    从邮件验证说起

    邮件的格式:

    tenssun@163.com

    其中tenssun是用户名,163.com是服务器名

    用户名只能由英文字母az(不区分大小写)、数字09、下划线组成。

    用户名的起始字符必须是英文字母.如:netease_2005

    用户名长度为520个字符。

    服务器名只能由英文字母az(不区分大小写)、数字09、下划线及点组成,@后点前面长度限制为1-10个字符,点后面的限制为com,cn,com.cn,net

    示例:

    $email='wjj7r8y6@jj.net';

    if(ereg ("^[a-zA-Z][0-9a-zA-Z_]{4,19}@[0-9a-zA-Z_]{1,10}(\.)(com|cn|com.cn|net)$",$email)) {

    echo 'email格式正确';

    }

    ?>

    ^ $

    看到前面的邮件验证大部分人可能会感到头痛,别急下面我们慢慢分解。

    还是得说说 ^ $ 他们是分别用来匹配字符串的开始和结束,下面法举例说明:

    "^The": 开头一定要有"The"字符串;

    "of despair$": 结尾一定要有"of despair" 的字符串; 那么,

    "^abc$": 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配

    "notice": 匹配包含notice的字符串 你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边 (开始或结束)

    '*', '+', '?',

    接着,说说 '*', '+', '?', 他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示:

    * 表示出现0次或1次或多次 相当于{0,},

    + 表示出现1次或多次 相当于{1,},

    ? 表示出现0次或1 相当于{0,1}, 这里是一些例子:

    "ab*": ab{0,}同义,匹配以a开头,后面可以接0个或者Nb组成的字符串("a", "ab", "abbb", );

    "ab+": ab{1,}同义,同上条一样,但最少要有一个b存在 ("ab", "abbb", .);

    "ab?":ab{0,1}同义,可以没有或者只有一个b;

    "a?b+$": 匹配以一个或者0a再加上一个以上的b结尾的字符串.

    要点:'*', '+', '?'只管它前面那个字符.

    { }

    你也可以在大括号里面限制字符出现的个数,比如

    "ah{2}": 要求a后面一定要跟两个h(一个也不能少)("ahh");

    "ah{2,}": 要求a后面一定要有两个或者两个以上h("ahh", "ahhhh", .);

    "ah{3,5}": 要求a后面可以有3-5h("ahhh", "ahhhh", or "ahhhhh").

    () {}

    现在我们把一定要的几个字符放到小括号里,比如:

    “a(bc)*”: 匹配 a 后面跟0个或者多个"bc";

    "a(bc){1,5}": 一个到5 "bc."

    '│'

    还有一个字符 '│', 相当于OR(或者) 操作:

    "hi│hello": 匹配含有"hi" 或者 "hello" 字符串;

    "(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串;

    "(a│b)*c": 匹配含有这样多个(包括0)ab,后面跟一个c 的字符串;

    '.'

    一个点('.')可以代表所有的单一字符,不包括"\n"

    如果,要匹配包括"\n"在内的所有单个字符,怎么办?

    '[\n.]'这种模式.

    "a.[0-9]": 一个a加一个字符再加一个09的数字

    ".{3}$": 三个任意字符结尾 .

    [ ]

    中括号括住的内容只匹配一个单一的字符

    "[ab]": 匹配单个的 a 或者 b ( "a│b" 一样);

    "[a-d]": 匹配'a' 'd'的单个字符 ("a│b│c│d" 还有 "[abcd]"效果一样); 一般我们都用[a-zA-Z]来指定字符为一个大小写英文

    "^[a-zA-Z]": 匹配以大小写字母开头的字符串

    "[0-9]%": 匹配含有 形如 x% 的字符串

    ",[a-zA-Z0-9]$": 匹配以逗号再加一个数字或字母结尾的字符串

    ^[][^ ]的区别

    你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^' 作为开头 "%[^a-zA-Z]%" 匹配含有两个百分号里面有一个非字母的字符串.

    要点:^用在中括号开头的时候,就表示排除括号里的字符

    不要忘记在中括号里面的字符是这条规路的例外在中括号里面, 所有的特殊字符,包括(''), 都将失去他们的特殊性质 "[*\+?{}.]"匹配含有这些字符的字符串.

    { } \b

    看了上面的例子,你对{n,m}应该理解了吧.要注意的是,nm都不能为负整数,而且n总是小于m. 这样,才能 最少匹配n次且最多匹配m. "p{1,5}"将匹配 "pvpppppp"中的前五个p

    下面说说以\开头的

    \b 书上说他是用来匹配一个单词边界,就是...比如've\b',可以匹配love里的ve而不匹配very里有ve

    \B 正好和上面的\b相反.例子我就不举了

    应用一

    ,说了这么多下面我们再回过头来看我们的邮件正则怎么构造的:

    用户名的正则表达式

    ^[a-zA-Z][0-9a-zA-Z_]{4,19}

    a-z表示az的所有小写字母,A-Z表示AZ的所有大写字母,但是[ ]只能取一个字符,所以[a-zA-Z]只能取其中一个符,也就是从所有的大小写英文字母中只能取一个字母,^放在[]外面表示开始, 所以^[a-zA-Z]表示以一个英文字母开头。

    应用二

    [0-9a-zA-Z_]表示从所有的阿拉伯数字和英文及_中取一个字符,{4,19}表示匹配最少4,最多9次显然

    [0-9a-zA-Z_]{4,19}表示前面的字符至少出现4,最多出现19.

    那么现在请问下面这个表达式所表达的意思

    ^[a-zA-Z][0-9a-zA-Z_]{4,19}

    (\.)表示一个点别和'.'混淆了'.'是表示除\n的任意一个字符()表示这是个子母式

    (com|cn|com.cn|net)$

    表示以comcncom.cnnet结尾的一串字符

    好了,今天就给大家讲这么多吧,喜欢我的内容可以关注或者分享(微信公众平台:tytedu)选择太原达内培训,不再孤军奋战,轻轻松松做IT高薪白领。太原达内培训带领有明确目标的学子迈向成功之路!

上一篇:Php是如何开发web的

下一篇:最通俗易懂的php正则表达式教程(中)

最新开班日期  |  更多

php高级开发名企定制班(剩2个名额)

php高级开发名企定制班(剩2个名额)

开班日期:12-29

php高级开发周末班(剩5个名额)

php高级开发周末班(剩5个名额)

开班日期:12-29

php高级开发免费试听(剩5个名额)

php高级开发免费试听(剩5个名额)

开班日期:12-29

更多高级开发工程师精品班

更多高级开发工程师精品班

开班日期:12-29

  • 地址:山西省太原市小店区学府街长治路高新国际A座24层
  • 课程培训电话:13623629309     全国服务监督电话:400-827-0010
  • 服务邮箱 ts@tedu.cn
  • 2001-2016 达内国际公司(TARENA INTERNATIONAL,INC.) 版权所有 京ICP证08000853号-56