博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Discuz截取字符串
阅读量:7013 次
发布时间:2019-06-28

本文共 1785 字,大约阅读时间需要 5 分钟。

hot3.png

 DZ截取字符串个人觉得比较好,特附上注释分析。

/**

$string 要截取的字符串
$length 保留多少个字节
$dot 结尾字符
*/

function cutstr($string, $length, $dot = ' ...') {

       if(strlen($string) <= $length) {// 如果字符串小于要给出的保留数就直接输出

              return $string;

       }

 

       $pre = chr(1);

       $end = chr(1);

// 把原程序中htmlspecialchars转换了的字符还原

       $string = str_replace(array('&amp;', '&quot;', '&lt;', '&gt;'), array($pre.'&'.$end, $pre.'"'.$end, $pre.'<'.$end, $pre.'>'.$end), $string);

 

       $strcut = ''; // 初始输出变量

  // 如果是utf-8编码(这个判断有点不全,有可能是utf8)

       if(strtolower(CHARSET) == 'utf-8') {

// 初始连续循环指针$n,最后一个字位数$tn,目前取到的字节数($noc+2没看明白是什么意//)

              $n = $tn = $noc = 0;

              while($n < strlen($string)) {

 

                     $t = ord($string[$n]);

                     if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {

// 如果是英语半角符号等,$n指针后移1,$tn最后字是1

                            $tn = 1; $n++; $noc++;

                     } elseif(194 <= $t && $t <= 223) {

// 如果是二字节字符$n指针后移2,$tn最后字是2

                            $tn = 2; $n += 2; $noc += 2;

                     } elseif(224 <= $t && $t <= 239) {

//如果是三字节(可以理解为中字词),$n后移3,$tn最后字是3

                            $tn = 3; $n += 3; $noc += 2;

                     } elseif(240 <= $t && $t <= 247) {

                            $tn = 4; $n += 4; $noc += 2;

                     } elseif(248 <= $t && $t <= 251) {

                            $tn = 5; $n += 5; $noc += 2;

                     } elseif($t == 252 || $t == 253) {

                            $tn = 6; $n += 6; $noc += 2;

                     } else {

                            $n++;

                     }

 // 超过了要取的数就跳出连续循环

                     if($noc >= $length) {

                            break;

                     }

 // 这个地方是把最后一个字去掉,以备加$dot

              }

              if($noc > $length) {

                     $n -= $tn;

              }

 

              $strcut = substr($string, 0, $n);

 

       } else {

 // 并非utf-8编码的全角就后移2

              for($i = 0; $i < $length; $i++) {

                     $strcut .= ord($string[$i]) > 127 ? $string[$i].$string[++$i] : $string[$i];

              }

       }

  // 再将特殊html转换(不明白有htmlspecialchars函数为什么不用)

       $strcut = str_replace(array($pre.'&'.$end, $pre.'"'.$end, $pre.'<'.$end, $pre.'>'.$end), array('&amp;', '&quot;', '&lt;', '&gt;'), $strcut);

 

       $pos = strrpos($strcut, chr(1));

       if($pos !== false) {

              $strcut = substr($strcut,0,$pos);

       }

       return $strcut.$dot; // 最后把截取加上$dot输出

}

转载于:https://my.oschina.net/chen08054/blog/34610

你可能感兴趣的文章
DSA数字签名算法
查看>>
Mongodb Mac安装
查看>>
中间件事务码R3AC1里Block Size的含义
查看>>
实战Android 上推下拉——隐藏、显示ActionBar
查看>>
GDB 调试 Mysql 实战(二)GDB 调试打印
查看>>
Spring AOP(三) Advisor类架构
查看>>
LeetCode 316. Remove Duplicate Letters
查看>>
第十三课时:递归组件的使用
查看>>
【跃迁之路】【712天】程序员高效学习方法论探索系列(实验阶段469-2019.2.2)...
查看>>
SpiderData 2019年2月18日 DApp数据排行榜
查看>>
react-refetch的使用小例子
查看>>
周末游攻略 - 南昌之行
查看>>
tcpdump查看Nginx长连接还是短连接
查看>>
Vue+thinkJs博客网站(二)之thinkJs的使用
查看>>
Electron学习笔记:主进程与渲染进程的通信方式
查看>>
JVM(六)为什么新生代有两个Survivor分区?
查看>>
Spark是一种基本的开源大数据技术
查看>>
Iterator 和 for...of 循环
查看>>
Font-face目前浏览器的兼容性
查看>>
Etcd超全解:原理阐释及部署设置的最佳实践
查看>>