郁闷的PHP字符串函数

王志勇 发表于 2009年01月29日 12:49

PHP的substr()是一个十分重要的函数,可以实现对字符串的处理,例如截取字符串的某部分,如把IP地址220.181.20.58替换为220.181.*.*,需要用到substr()函数。让人郁闷的是,substr()不支持中文,会产生乱码。JavaScript的substr()函数和ASP的Mid()函数,无论是UTF-8还gb2312编码,都可以很好地直接支持中文。

另外如$pep="和平海底"; $auf=$pep[1];,$auf的结果是乱码,而不是“平”。如果使用数组array()函数如:$pep=array("和", "平", "海", "底"); $auf=$pep[1];,$auf的结果是仍然是乱码。

如果substr()或者array()的处理字符是英文或者数字、半角符号,则没有问题。我用PHP4和PHP5测试了一下,都有此问题。在网上搜索了一下,因为PHP把处理的全角字符的字节拆开来处理,ANSI编码拆为2个字节,UTF-8编码拆为3个字节,需要另外一段程序,如“php 截取”。如果大量地使用substr(),再加上另外的这段程序来处理段落的中文字符,在一定程度上大大降低了程序的效率,增加服务器的负担和成本。

PHP的替换函数str_replace(),以及查找字符的位置strpos()函数,则可以很好地直接支持中文全角字符。

4条评论:
1   zeal 2009-02-01 13:34
安装mb库,用mb_前缀的字符串处理函数来处理多字节字符串。
2   自由勇 2009-02-01 18:15
谢谢。:)
3   CodeBit.cn 2009-02-02 15:05
$pep=array("和", "平", "海", "底");
$auf=$pep[1];

这个应该会返回 "平",
造成乱码有时会和文件编码还有meta中声明有关。

4   自由勇 2009-02-02 19:07
文件编码、meta都使用UTF-8,
使用header()设定UTF-8,也都有substr()中文乱码的问题。
在不使用mb_substr()的情况下。:)

发表评论:
名字: (*必填)
博客: (可省)

正文:

  记住信息?

直接发送Trackback到此文章

说明:本评论系统不支持HTML代码。(您的留言需要审核,审核规则请见这里。)

文章分类 Category:
真相与UFO Truth and UFO
编程 Program
PHP
Blog的发展 Development
为什么写博客 W-do we Blog
互联网 Internet
BBS社区研究 Community
QQ研究 QQ Research

置顶的文章:
短信验证开发的方案分享
我的3种博客写作方法
最大的公益事业是UFO
巡回更新:2018-09-21
速度是永恒的主题
UTF-8、HTTPS原来都是浮云
为什么写技术(2018.9.23写)

近期的主题:
UTF-8、HTTPS原来都是浮云
为什么写技术
暂时放弃了开发VPS面板的想法
速度是永恒的主题
2017.12-2018.9写的博客
巡回更新:2018-09-21
2017.7第2篇
auiou.com今天换上了KVM
CentOS, Debian, Ubuntu三种VPS系统的LAMP属性小结
Debian 6.0和Ubuntu 14.04新装机的参数记录
Linux VPS的速度优化
Nginx与.htaccess
CentOS 6新装机的参数记录
auiou.com的VPS的内存占用测试
2016年8月第一帖
不喜欢锻炼身体的朋友
看《第五空间》
看《爱情公寓》的一点感想
生命的意义在于每一天都是人生的开始
安卓机顶盒收到小记
人生中最可怕的事情是拖延
不能贪吃/不能贪喝/不能贪凉
“世面”和人生意义
计划推出一个重要的“网络存档”(网络记事本)快速小程序
最近几个月博客更新减缓的原因
汽车越来越多
编写完成了清爽的贴吧浏览程序/贴吧占用内存测试
猫/无线路由器/瑞银无线网卡 最简单有效的散热方法
最近录制的歌
家用无线路由器选购的一些建议
网络电视机顶盒选购的一些建议
无线路由器当作无线交换机实例
2013-08-08:人生的意义&谨言慎行
怎样对治重症的拖沓的毛病?
磊科NW336无线网卡使用感受
腾达311R无线路由器频繁掉线解决一例(其它品牌和型号可能也适用)

王志勇:程序设计者。
1980-09-26 (38周岁)

版权声明:本博客所有文章,均符合原创的定义,禁止转载,违者将必究;正确的方法是贴原文的标题和网址即可。

与此相关的链接
自由勇专栏 | Arsue官方Blog

54.225.59.14 2018-09-23_05:58 | CCBot/2.0 (https://commoncrawl.org/faq/) ---
Time | Taimt | Caimt | ac315 | Arsue | IC Search | TDNote 帖笛 | HKANS | Vaimt Panel | txfor | 网树 | cdfor | 性格追踪仪 | Gratitude | IXNes | Tratom | Coumit | Serble | Aufirm | Aroat | Sail every day | Tuarm | Sail every day | Webshu | Sinvide | Aucist | Anydiary | Cersta | Tovate | Matnue | Urtal | Auciou | Auciou's column

Blog存档 Archives

2018年09月
2016年-2017年(9)
2014年06月-09月(10)
2013年 +

2012年 +
2011年 +
2010年 +
2009年 +
2008年 +
2007年 +
2006年 +
2005年09月(4)

Copyright © 2006-2018 auiou.com All rights reserved.
此Blog程序由王志勇编写 已经发布在Arsue