仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1072|回复: 18
打印 上一主题 下一主题

[学习教程] PHP编程:技能:PHP关于中文汉字交换与形式婚配的...

[复制链接]
小魔女 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-2-4 00:01:50 | 显示全部楼层 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
应该大致熟悉了一些学习过程,也许我的过程和你的有些出路,但是不管怎么样是殊途同归,我写这么多,也只是给大家一个借鉴的机会,至于好与不好,默默不敢打包票^0^     这两天正在做一个关头字加亮显示的法式,写好的法式在当地测试也跑得好好的,可是一上去页面就呈现一堆一堆的乱码,别说加亮了,几乎就是没的看!
  我就找毛病,找来找去,发明英文没有成绩,碰到汉字轻易出成绩,有的时分碰到汉字必出成绩。
  总结一下:
  当利用形式婚配的时分,如:preg_match_all($pat,……)与preg_replace($pat,……)……
  轻易出成绩的情形以下:
  preg_match_all("/(汉字)+/ism","我是汉字,看你把我怎样着!",$m_a);
  这个形式很复杂就是婚配出“汉字”。这类情形形式中包括汉字可以胜利婚配出来,然而也不要乐意得太早,了局不肯定,为何不肯定你渐渐往下看。
  必呈现成绩情形以下:
  preg_match_all("/[汉字]+/ism","我是汉字,看你把我怎样着!",$m_a);
  本想婚配呈现“汉”、“字”或“汉字”。这个必呈现成绩,婚配的了局一大群乱码,没准还会出个逝世轮回呢。为何会呈现这类情形?是由于PHP外部利用不是UNICODE,不撑持多字节文字,所以一个"汉字"就被当做4bytes的ASCII去停止形式婚配,不失足才怪呢!
  后来我又尝尝从头写一下形式婚配,发明一种仿佛(为何说仿佛?往后看)办法可以处理:
  preg_match_all("/(汉|字)+/ism","我是汉字,看你把我怎样着!",$m_a);
  如许写可以婚配出“汉”、“字”或“汉字”,$m_a中的了局
Array
(
[0] => Array
(
[0] => 汉字
)
[1] => Array
(
[0] => 字
)
)
  怎样全婚配的字符串呈现了吧!可是乐意得太早了,后来在实践顶用仍是会常常出成绩!再去找成绩,终究找到成绩的根了!PHP不撑持多字节文字,所以在停止形式婚配与字符操作的时分都是内码转化落后行的(我不晓得如许说对不合错误),举个实例吧:
  eregi_replace("性","没有" , "有义务感");这个操作就是要把字符串"有义务感"中"性"字交换成"没有",最初的了局是甚么?由于"有义务感"中没有"性"就个字,了局应当是没有履行交换操作前往"有义务感",可是了局居然是"用挥叙任感"!
  没想到吧!为何?看一下ASCII码你就分明了,2个ASCII码代码一个汉字"有义务感"的ASCII编码顺次为:211,208(有),212,240(责),200,206(任),184,208(感) 
  而"性"的编码为:208,212(性),刚好与有的第2字节和责的第1字节组合是分歧的!所以PHP就熟悉找到不异的形式停止婚配,拆成一半的汉字再与交换后的字串停止组合,所以就失足了!
  事先我想最经常使用的str_replace(),应当不会有成绩的,然而现实上str_replace()履行一样的操作也会失足!如今我想之前停止汉字交换其实是太侥幸了!多是谁人时分停止的汉字交换都是对照长的汉字串吧,不太轻易呈现以上的情形。即便没有出成绩,也要晓得那是不平安的!
  成绩是有的,任务还要持续做,克制的坚苦也就::::如今的自我了。
  好在想起一组PHP的扩大模块,Multibyte String Functions,添加很多撑持多字节文字的操作的函数,如:ereg_replace() 对应着mb_ereg_replace() 等等。详细的函数申明请查询相干的文章。
  总结:关于中文汉字平安的操作最好是利用Multibyte String Functions。
学习了六个多月PHP了,还是个新手,在这里受到了很多人的帮助,谢谢你们!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-5-14 16:13

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表