本地
➜ ~ echo '你好' 你好 ➜ ~ 你好 zsh: command not found: 你好 ➜ ~ locale LANG="en_US.UTF-8" LC_COLLATE="en_US.UTF-8" LC_CTYPE="en_US.UTF-8" LC_MESSAGES="en_US.UTF-8" LC_MONETARY="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" LC_ALL="en_US.UTF-8"
服务器(ssh登录)
root@hg:~# echo '你好' 你好 # 这一串玩意是utf8吗 root@hg:~# 你好 -bash: $'\344\275\240\345\245\275': command not found root@hg:~# locale LANG=en_US.utf8 LANGUAGE= LC_CTYPE="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" LC_COLLATE="en_US.UTF-8" LC_MONETARY="en_US.UTF-8" LC_MESSAGES="en_US.UTF-8" LC_PAPER="en_US.UTF-8" LC_NAME="en_US.UTF-8" LC_ADDRESS="en_US.UTF-8" LC_TELEPHONE="en_US.UTF-8" LC_MEASUREMENT="en_US.UTF-8" LC_IDENTIFICATION="en_US.UTF-8" LC_ALL=en_US.UTF-8
为什么服务端明明支持utf-8却显示为\344\275\240\345\245\275
呢? 为什么echo '你好'
就正常呢? 另外utf8有好几种吗?
如
select hex('你好'); +---------------+ | hex('你好') | +---------------+ | E4BDA0E5A5BD | +---------------+
怎么一个你好
有三种utf8编码呢?
344275240345245275
E4BDA0E5A5BD
你好
这个并不矛盾。
服务器端显示的'\344\275\240\345\245\275'这串字符其实就是'你好'的utf-8编码。
其中八进制的344\275\240就是“你”的UTF-8编码,八进制的345\245\275就是“好”。
在内部存储的时候都是以这些进制的数值形式存储在计算机内部的。
那为什么会显示不一样?
如果当前终端的驱动程序能够识别UTF-8编码就能打印出汉字,如果当前终端的驱动程序不能识别UTF-8编码就打印不出汉字。