热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

整理HTML5中支持的URL编码与字符编码_html5教程技巧

这篇文章主要介绍了整理HTML5中支持的URL编码与字符编码,URL方面对HTML5用到无刷新修改URL等功能的实现时可以借鉴,字符编码则要注意BOM问题,需要的朋友可以参考下
URL 编码
URL 编码就是将 URLs 中不宜打印的字符或者具有特殊意义的字符转换为 Web 浏览器和服务器明白且普遍接受的表示法。 这些字符包括:

ASCII 控制字符 - 不宜打印的字符通常用于输出控制。字符范围是十六进制的 00-1F(十进制的 0-31)和 7F(十进制的 127)。下面提供了完整的编码表。

非 ASCII 控制字符 - 这些字符超出了 128 个 ASCII 字符集的范围。这个范围是 ISO-拉丁字符集的一部分以及包含整个十六进制的 ISO-拉丁字符集 00-FF (十进制的 128-255)的“前半部分”。下面提供了完整的编码表。

保留字符 - 诸如美元符号,和号,加号,通用符号,正斜杠,冒号,分好,等号,问号以及 “at”这类符号。所有这些符号在 URL 内都有不同的意义,因此需要编码。下面提供了完整的编码表。

不安全字符 - 包括空格,问号,小于符号,大于符号,磅字符,百分比符号,大括号左边部分,大括号右边部分,管道符,反斜杠,插入符号,波浪线。左方括号,右方括号,沉音符。出于某些原因,这些字符出现在 URLs 中存在被误解的可能性。这些字符也应该始终被编码。下面提供了完整的编码表。
编码表示法需要三个字符替换期望的字符:一个百分号,两个在 ASCII 字符集中表示字符位置的十六进制数字、

示例
最常见的特殊字符之一便是空格。我们不能在 URL 中直接输入一个空格。空格在字符集中就是十六进制的 20。因此请求服务器时可以使用 %20 表示空格。


代码如下:

http://www.example.com/new%20pricing.html


这个 URL 实际上是从 www.example.com 检索一个名为 new pricing.html 的文档。

ASCII 控制字符编码
包括十六进制的 00-1F(十进制的 0-31)和 7F(十进制的 127)字符码。

十进制格式 十六进制值 字符 URL 编码
0 00 %00
1 01 %01
2 02 %02
3 03 %03
4 04 %04
5 05 %05
6 06 %06
7 07 %07
8 08 退格符 %08
9 09 tab %09
10 0a 换行符 %0a
11 0b %0b
12 0c %0c
13 0d 回车符 %0d
14 0e %0e
15 0f %0f
16 10 %10
17 11 %11
18 12 %12
19 13 %13
20 14 %14
21 15 %15
22 16 %16
23 17 %17
24 18 %18
25 19 %19
26 1a %1a
27 1b %1b
28 1c %1c
29 1d %1d
30 1e %1e
31 1f %1f
127 7f %7f

非 ASCII 控制字符编码
包括整个十六进制的 ISO-拉丁字符集 80-FF(十进制的 128-255)编码的“前半部分”。
十进制格式 十六进制值 字符 URL 编码
128 80 %80
129 81 ? %81
130 82 ? %82
131 83 ? %83
132 84 ? %84
133 85 %85
134 86 ? %86
135 87 ? %87
136 88 ? %88
137 89 %89
138 8a ? %8a
139 8b ? %8b
140 8c ? %8c
141 8d ? %8d
142 8e ? %8e
143 8f ? %8f
144 90 ? %90
145 91 %91
146 92 %92
147 93 %93
148 94 %94
149 95 ? %95
150 96 %96
151 97 %97
152 98 ? %98
153 99 ? %99
154 9a ? %9a
155 9b ? %9b
156 9c ? %9c
157 9d ? %9d
158 9e ? %9e
159 9f ? %9f
160 a0 %a0
161 a1 ? %a1
162 a2 %a2
163 a3 %a3
164 a4 ¤ %a4
165 a5 %a5
166 a6 | %a6
167 a7 § %a7
168 a8 ¨ %a8
169 a9 ? %a9
170 aa a %aa
171 ab ? %ab
172 ac ? %ac
173 ad - %ad
174 ae ? %ae
175 af ˉ %af
176 b0 ° %b0
177 b1 ± %b1
178 b2 2 %b2
179 b3 3 %b3
180 b4 %b4
181 b5 μ %b5
182 b6 ? %b6
183 b7 · %b7
184 b8 ? %b8
185 b9 1 %b9
186 ba o %ba
187 bb ? %bb
188 bc ? %bc
189 bd ? %bd
190 be ? %be
191 bf ? %bf
192 c0 à %c0
193 c1 á %c1
194 c2 ? %c2
195 c3 ? %c3
196 c4 ? %c4
197 c5 ? %c5
198 c6 ? %v6
199 c7 ? %c7
200 c8 è %c8
201 c9 é %c9
202 ca ê %ca
203 cb ? %cb
204 cc ì %cc
205 cd í %cd
206 ce ? %ce
207 cf ? %cf
208 d0 D %d0
209 d1 ? %d1
210 d2 ò %d2
211 d3 ó %d3
212 d4 ? %d4
213 d5 ? %d5
214 d6 ? %d6
215 d7 × %d7
216 d8 ? %d8
217 d9 ù %d9
218 da ú %da
219 db ? %db
220 dc ü %dc
221 dd Y %dd
222 de T %de
223 df ? %df
224 e0 à %e0
225 e1 á %e1
226 e2 a %e2
227 e3 ? %e3
228 e4 ? %e4
229 e5 ? %e5
230 e6 ? %e6
231 e7 ? %e7
232 e8 è %e8
233 e9 é %e9
234 ea ê %ea
235 eb ? %eb
236 ec ì %ec
237 ed í %ed
238 ee ? %ee
239 ef ? %ef
240 f0 e %f0
241 f1 ? %f1
242 f2 ò %f2
243 f3 ó %f3
244 f4 ? %f4
245 f5 ? %f5
246 f6 ? %f6
247 f7 &pide; %f7
248 f8 ? %f8
249 f9 ù %f9
250 fa ú %fa
251 fb ? %fb
252 fc ü %fc
253 fd y %fd
254 fe t %fe
255 ff ? %ff

保留字符编码
下表用于编码保留字符。
十进制格式 十六进制值 字符 URL 编码
36 24 $ %24
38 26 & %26
43 2b + %2b
44 2c , %2c
47 2f / %2f
58 3a : %3a
59 3b ; %3b
61 3d = %3d
63 3f ? %3f
64 40 @ %40

不安全字符编码
下表用于编码不安全字符。
十进制格式 十六进制值 字符 URL 编码
32 20 space %20
34 22 " %22
60 3c < %3c
62 3e > %3e
35 23 # %23
37 25 % %25
123 7b { %7b
125 7d } %7d
124 7c | %7c
92 5c \ %5c
94 5e ^ %5e
126 7e ~ %7e
91 5b [ %5b
93 5d ] %5d
96 60 ` %60

字符编码

字符编码就是将字节转换为字符的一种方法。要验证或者显示一个 HTML 文档,程序必须选择一个字符编码。HTML5 作者有三种方式设置字符编码:

HTTP Content-Type 头:
如果你在编写 cgi 程序或者类似的程序,那么可以使用 HTTP Content-Type 头设置任意字符编码:

下面是一个简单的例子:

XML/HTML Code复制内容到剪贴板

  1. print "Content-Type: text/html; charset=utf-8\r\n";

元素:
可以使用带有 charset 属性的 元素指定 HTML5 文档前 512 个字节的编码:

下面是简化的例子:

XML/HTML Code复制内容到剪贴板

  1. <meta charset="UTF-8">

尽管这种语法是被允许的,但上述语法需要使用 替换。

Unicode 字节顺序标记(BOM)
一个字节顺序标记(BOM)由数据流开头的 U+FEFF 字符码组成,它可以用作定义字节顺序和编码形式的签名,主要是未标记的明文文件。

许多 Windows 程序(包括 Windows 记事本)都会在保存为 UTF-8 的任意文档开头添加 0xEF, 0xBB, 0xBF。这就是 Unicode 字节顺序标记(BOM)的 UTF-8 编码,通常被称为 UTF-8 BOM,尽管它和字节顺序没有关系。

对于 HTML5 文档,我们可以在文件的开头使用 Unicode 字节顺序标记(BOM)字符。这个字符为使用的编码提供了签名。

推荐阅读
  • 本文介绍了使用AJAX的POST请求实现数据修改功能的方法。通过ajax-post技术,可以实现在输入某个id后,通过ajax技术调用post.jsp修改具有该id记录的姓名的值。文章还提到了AJAX的概念和作用,以及使用async参数和open()方法的注意事项。同时强调了不推荐使用async=false的情况,并解释了JavaScript等待服务器响应的机制。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 本文讨论了Alink回归预测的不完善问题,指出目前主要针对Python做案例,对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法,以及Maven的相关知识。最后,对Alink回归预测的未来发展提出了期待。 ... [详细]
  • 禁止程序接收鼠标事件的工具_VNC Viewer for Mac(远程桌面工具)免费版
    VNCViewerforMac是一款运行在Mac平台上的远程桌面工具,vncviewermac版可以帮助您使用Mac的键盘和鼠标来控制远程计算机,操作简 ... [详细]
  • 本文内容为asp.net微信公众平台开发的目录汇总,包括数据库设计、多层架构框架搭建和入口实现、微信消息封装及反射赋值、关注事件、用户记录、回复文本消息、图文消息、服务搭建(接入)、自定义菜单等。同时提供了示例代码和相关的后台管理功能。内容涵盖了多个方面,适合综合运用。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 基于layUI的图片上传前预览功能的2种实现方式
    本文介绍了基于layUI的图片上传前预览功能的两种实现方式:一种是使用blob+FileReader,另一种是使用layUI自带的参数。通过选择文件后点击文件名,在页面中间弹窗内预览图片。其中,layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块,并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • 本文是一位90后程序员分享的职业发展经验,从年薪3w到30w的薪资增长过程。文章回顾了自己的青春时光,包括与朋友一起玩DOTA的回忆,并附上了一段纪念DOTA青春的视频链接。作者还提到了一些与程序员相关的名词和团队,如Pis、蛛丝马迹、B神、LGD、EHOME等。通过分享自己的经验,作者希望能够给其他程序员提供一些职业发展的思路和启示。 ... [详细]
author-avatar
亚璨的秘密
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有