热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

是否真的PHP中的字符串文字只能编码为ASCII的兼容超集,如UTF-8或ISO-8859-1?

如何解决《是否真的PHP中的字符串文字只能编码为ASCII的兼容超集,如UTF-8或ISO-8859-1?》经验,为你挑选了1个好方法。

我从PHP手册的"字符串类型"页面的详细信息中看到以下文本:

鉴于PHP没有规定字符串的特定编码,人们可能想知道字符串文字是如何编码的.字符串将以脚本文件中编码的任何方式进行编码.因此,如果脚本是用ISO-8859-1编写的,则字符串将以ISO-8859-1编码,依此类推.但是,如果启用了Zend Multibyte,则不适用; 在这种情况下,脚本可以用任意编码(明确声明或检测到)编写,然后转换为某种内部编码,然后编码将用于字符串文字.请注意,对脚本的编码存在一些限制(或者在内部编码上,如果启用了Zend Multibyte) - 这几乎总是意味着此编码应该是ASCII的兼容超集,例如UTF-8或ISO-8859 -1.

所以我的疑问是,PHP中的字符串文字只能编码为ASCII的兼容超集编码,例如UTF-8ISO-8859-1,而不是编码不兼容的超集的ASCII

是否有可能以编码在PHP字符串文字在一些非ASCII兼容像编码UTF-16,UTF-32或一些其它这样的非ASCII兼容编码?如果是,那么在这种非ASCII兼容编码中编码的字符串文字是否可以与mb_string_*函数一起使用?如果不是,那是什么原因?

假设,Zend Multibyte已启用,我已将内部编码设置为兼容ASCII超集,例如UTF-8ISO-8859-1或其他一些非ASCII兼容编码.现在,我可以在脚本文件中声明不是ASCII 兼容超集的编码,例如UTF-16UTF-32吗?

如果是,那么在这种情况下编码字符串文字的编码是什么?如果不是,那是什么原因?

另外,如果启用了Zend Multibyte,请解释一下这个编码对于字符串文字是如何工作的?

如何启用Zend Multibyte?背后有什么把它的主要意图?当需要把它

如果你能用合适的例子清楚我的怀疑,那会更好.

谢谢.



1> deceze..:

PHP源代码文件中的字符串文字按字面意义视为源代码文件中存在的原始字节。如果您的源代码中有表示UTF-16字符串的字节或其他真正的字节,则可以直接使用它们:

$ echo -n ' test.php
$ echo -n ??? | iconv -t UTF-16 >> test.php 
$ echo '";' >> test.php 
$ cat test.php 


这演示了一个表面上用ASCII编写的源代码文件,但中间包含一个UTF-16字符串文字,该文件原样输出。

这种源代码的最大问题是很难使用。介于痛苦之间,无法让文本编辑器以一种编码方式处理PHP代码,以另一种编码方式处理字符串文本。因此,通常,您希望将整个源代码(包括字符串文字)保持为一种且始终采用相同的编码。

您也很容易遇到麻烦:

$ echo -n ' test.php
$ echo -n ?? | iconv -t UTF-16 >> test.php 
$ echo '";' >> test.php 
$ cat test.php | xxd
00000000: 3c3f 7068 7020 6563 686f 2022 feff 6f22  

“?” 此处编码为feff 6f22 5b57,其中包含22",是字符串文字终止符,这意味着您现在遇到语法错误。

默认情况下,PHP解释器期望PHP代码与ASCII兼容,因此,如果您希望将字符串文字和其余的源代码保持在相同的编码中,则几乎仅限于与ASCII兼容的编码。但是,如果相应地声明使用的编码,则Zend Multibyte扩展名允许您使用其他编码(如果不兼容ASCII,则在php.ini中)。因此,您可以始终使用Shift-JIS编写源代码。甚至可能还有其他一些编码形式的字符串文字*。

*(这时我将不再赘述,因为您怎么了?!)

摘要:

PHP必须了解所有PHP代码;默认情况下,它可以理解ASCII,通过Zend Multibyte,它也可以理解其他编码。

源代码中的字符串文字可以包含所需的任何字节,只要PHP不会将它们解释为字符串文字中的特殊字符(例如,22上面的示例),在这种情况下,您需要对它们进行转义(使用反斜杠)通用源代码的编码)。

运行时的字符串值将是从字符串文字中读取的原始字节序列PHP。

综上所述,与ASCII兼容编码相背离通常是一个痛苦的过程。如果您的工作流程中的某些工具对文件的处理不正确,这在文本编辑器中是很痛苦的,并且很容易导致mojibake。我最多建议使用兼容ASCII的编码,例如:

echo "???";  // UTF-8 encoded (let's hope)

如果必须具有不兼容ASCII的字符串文字,则应使用字节符号:

echo "\xfe\xff\x65\xe5\x67\x2c\x8a\x9e";

或转换:

echo iconv('UTF-8', 'UTF-16', '???');

[..]以这种非ASCII兼容编码之一编码的字符串文字是否可以与mb_string_*函数一起使用?

当然,出于所有目的和目的,PHP中的字符串都是原始字节数组。无论如何获取该字符串都无关紧要。如果您具有通过上述任何一种方法获得的UTF-16字符串(包括通过将其以UTF-16形式硬编码为源代码),则您具有UTF-16编码的字符串,可以将其放入任何和所有的字符串函数中,知道如何处理。


推荐阅读
  • C++字符字符串处理及字符集编码方案
    本文介绍了C++中字符字符串处理的问题,并详细解释了字符集编码方案,包括UNICODE、Windows apps采用的UTF-16编码、ASCII、SBCS和DBCS编码方案。同时说明了ANSI C标准和Windows中的字符/字符串数据类型实现。文章还提到了在编译时需要定义UNICODE宏以支持unicode编码,否则将使用windows code page编译。最后,给出了相关的头文件和数据类型定义。 ... [详细]
  • Java中包装类的设计原因以及操作方法
    本文主要介绍了Java中设计包装类的原因以及操作方法。在Java中,除了对象类型,还有八大基本类型,为了将基本类型转换成对象,Java引入了包装类。文章通过介绍包装类的定义和实现,解答了为什么需要包装类的问题,并提供了简单易用的操作方法。通过本文的学习,读者可以更好地理解和应用Java中的包装类。 ... [详细]
  • 流数据流和IO流的使用及应用
    本文介绍了流数据流和IO流的基本概念和用法,包括输入流、输出流、字节流、字符流、缓冲区等。同时还介绍了异常处理和常用的流类,如FileReader、FileWriter、FileInputStream、FileOutputStream、OutputStreamWriter、InputStreamReader、BufferedReader、BufferedWriter等。此外,还介绍了系统流和标准流的使用。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • C语言注释工具及快捷键,删除C语言注释工具的实现思路
    本文介绍了C语言中注释的两种方式以及注释的作用,提供了删除C语言注释的工具实现思路,并分享了C语言中注释的快捷键操作方法。 ... [详细]
  • 1,关于死锁的理解死锁,我们可以简单的理解为是两个线程同时使用同一资源,两个线程又得不到相应的资源而造成永无相互等待的情况。 2,模拟死锁背景介绍:我们创建一个朋友 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 动态规划算法的基本步骤及最长递增子序列问题详解
    本文详细介绍了动态规划算法的基本步骤,包括划分阶段、选择状态、决策和状态转移方程,并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中,在以后尽可能多地利用这些子问题的解,从而提高算法的效率。 ... [详细]
  • 猜字母游戏
    猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ... [详细]
  • 怎么在PHP项目中实现一个HTTP断点续传功能发布时间:2021-01-1916:26:06来源:亿速云阅读:96作者:Le ... [详细]
  • java io换行符_Java IO:为什么从stdin读取时,换行符的数字表示出现在控制台上?...
    只是为了更好地理解我在讲座中听到的内容(关于Java输入和输出流),我自己做了这个小程序:publicstaticvoidmain(String[]args)thro ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 1关于字符串相邻的两个或多个字符串字面值(引号引起来的字符)将会自动连接到一起:str_catpython!str_cat输出:python!把很长 ... [详细]
author-avatar
贝贝不离
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有