您的位置:威尼斯官方网站 > 威尼斯正规官网 > 获取指定的中文与字符

获取指定的中文与字符

发布时间:2019-08-05 17:09编辑:威尼斯正规官网浏览(127)

    大家先要掌握
    华语双字节字符编码范围

    1. GBK (GB2312/GB18030)
      x00-xff GBK双字节编码范围
      x20-x7f ASCII
      xa1-xff 中文 gb2312
      x80-xff 中文 gbk

    2. UTF-8 (Unicode)

    u4e00-u9fa5 (中文)
    x3130-x318F (韩文
    xAC00-xD7A3 (韩文)
    u0800-u4e00 (日文)

    获取钦点的中文与字符
    例1

     代码如下

    <?php
    $str = '正则如何合营中文字在某普通话字符串中?';
    preg_match("/中/",$str,$regs);
    print_r($regs);
    ?>

    输出
    Array
    (
        [0] => 中
    )

    例2

     代码如下

    <?php
    $str = '这里是华语 this is English';
    //把中文形成鼠灰
    echo preg_replace("/([x80-xff].)/","<font color=red>1</font>",$str);
    //把非粤语变成鲜蓝
    echo preg_replace("/([x20-x7f])/","<font color=red>1</font>",$str);
    ?>

     

    签里面有普通话、德文、数字等混排,则须要对汉字进行超过常规规处理,由于PCRE不援救U P L之类的perl字符串管理转义,使用16进制或然Unicode举行拍卖,范比方下:

     代码如下

    $str = "之二宽阔的甘家口东#标签1#标签2 #标签3。#标签4,都发$1234 ¥xc,cvm , ¥12,dflksjf如何#标签5.x #tag6.cvxcv“";
    preg_match_all('/#([a-zA-Z0-9x7f-xff] )/', $str, $mat);
    print_r($mat);

    preg_match("/[x{00a5}x{ffe5}](d )/u", $str, $mat);
    print_r($mat);

    最终笔者清楚了php中utf-8编码下用正则表明式匹配汉字的终极准确表达式——/^[x{4e00}-x{9fa5}] $/u

     代码如下

    $str = "php编程";
    if (preg_match("/^[x{4e00}-x{9fa5}] $/u",$str)) {
    print("该字符串全部都以华语");
    } else {
    print("该字符串不全部都以华语");
    }

    实例

    上边那款相配中文字符串正则表达式是一款利用数组,然后 多次for把全部是汉语字符串的打字与印刷出来。
    */  

     代码如下

    $str_arr = array(
    "iameverysorry",
    "欢快编制程序,欢腾生活",
    "php教程编制程序",
    "一九九八年香江回归",
    "波兰语学习abc",
    "www.111cn.net"
    );

    $patt_ch = chr(0xa1) . "-" . chr(0xff);

    foreach ($str_arr as $str)
    {
        echo "字符串'$str' 是";
        if (preg_match("/^[$patt_ch] $/", $str))
        {
            echo "<b>完全汉语</b>";
            echo "<br>";
            echo "<br>";
        }
        else
        {
            echo "非完全中文";
            echo "<br>";
            echo "<br>";
        }
    }

    更加多详细内容请查看:

    本文由威尼斯官方网站发布于威尼斯正规官网,转载请注明出处:获取指定的中文与字符

    关键词:

上一篇:memcached使用内存缓存数据

下一篇:没有了