编程语言您现在的位置是:首页 > 博客日志 > 编程语言

php正则表达式处理方面的一个坑,php中文正则表达式

<a href='mailto:'>微wx笑</a>的头像微wx笑2019-09-20 10:13:09编程语言人已围观关键字:正则,表达式,校验,php

简介前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。

前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。6rO编程技术_踩坑日志_进阶指南 - 无知人生

JS代码:

        var reg = /^[\u4E00-\u9FA5A-Za-z0-9]+$/;
        if (formData.author != undefined && formData.author.length > 0){
          if(!reg.test(formData.author)){
              that.toast('姓名格式错误,可包含中文、英文及数字');
              return false;
          }
        }

php代码:

    $author = trim(RepPostVar($add[author]));
    if ($author){
        if (strlen($author) < 5 || strlen($author) > 20){
            lgyPl_v2::printerror("AuthorLenFail","history.go(-1)",1);
        }
          if (!preg_match("/^[\u4E00-\u9FA5A-Za-z0-9]+$/",$author)) {
              lgyPl_v2::printerror("AuthorFail","history.go(-1)",1);
       }
    }

验证电子邮件地址和个人网址的正则表达式都工作正常,估计这个是跟“\u4E00-\u9FA5”有关。6rO编程技术_踩坑日志_进阶指南 - 无知人生


6rO编程技术_踩坑日志_进阶指南 - 无知人生

解决方案:

php正则表达式匹配中文时的写法与JS不同。6rO编程技术_踩坑日志_进阶指南 - 无知人生

如下,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!JS使用“\u4E00”的形式,php中要使用“\x{4E00}”的形式6rO编程技术_踩坑日志_进阶指南 - 无知人生

      	if (!preg_match("/^[\x{4E00}-\x{9FA5}A-Za-z0-9]+$/u",$author)) {
      		lgyPl_v2::printerror("AuthorFail","history.go(-1)",1);
     	}

u (PCRE_UTF8)

此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。6rO编程技术_踩坑日志_进阶指南 - 无知人生

utf8格式的匹配模式字符串必须要使用  u 修饰符。 否则出现程序意料之外的异常情况。6rO编程技术_踩坑日志_进阶指南 - 无知人生

PHP的中文正则表达式: 

/^[\x{4e00}-\x{9fa5}]+$/u


6rO编程技术_踩坑日志_进阶指南 - 无知人生

本文由 微wx笑 创作,采用 CC BY-NC 4.0 许可协议。 非商业性使用可自由转载、引用、甚至修改,但需署名作者且注明出处。

很赞哦! () 有话说 ()

站点信息

  • 建站时间:2018-10-24
  • 服务期限阿里云ECS 2027年到期
  • 主题模板:基于《今夕何夕》修改
  • 文章统计:210篇
  • 文章评论:15条
  • 文章阅读:2818次
  • 文章点赞:1026次
  • 微信公众号:扫描二维码,关注我们
  • 二维码-微信公众号-微wx笑