短.be

百分号编码

2025年9月18日 · 约 1 分钟阅读

短链接

百分号编码是 URL 编码的正式技术名称,定义在 RFC 3986 中。它使用 "%" 符号后跟两位十六进制数来表示一个字节的值。例如,"%20" 表示空格 (ASCII 值 32,十六进制 20),"%2F" 表示正斜杠 "/"。

百分号编码的工作原理是将字符的 UTF-8 字节序列中的每个字节转换为 "%XX" 格式。对于 ASCII 字符,这是单字节转换;对于多字节的 Unicode 字符 (如中文),每个字节都会被单独编码。例如,汉字 "中" 的 UTF-8 编码为 3 个字节 (E4 B8 AD),百分号编码后为 "%E4%B8%AD"。欢迎参阅在 Amazon 搜索字符编码书籍

RFC 3986 将 URL 中的字符分为三类:未保留字符 (字母、数字、-、_、.、~) 可以直接使用;保留字符 (:、/、?、#、[、]、@、!、$、&、'、(、)、*、+、,、;、=) 在特定上下文中有特殊含义;其他所有字符必须进行百分号编码。

在 URL 缩短服务的开发中,正确处理百分号编码至关重要。服务需要能够接受包含已编码字符的 URL、避免双重编码、在数据库中以规范化形式存储 URL、并在重定向响应中正确输出编码后的 URL。在 Amazon 搜索网络协议书籍深入探讨了这些规范。

相关术语

想要创建短链接吗?

免费缩短网址