XML Schema xs:token与string区别 XSD中空白字符的处理规则

2次阅读

xs:token 会自动去除首尾空白并将内部连续空白（含制表符、换行符）压缩为单个空格，而 xs:string 不做任何空白处理；二者语义适用场景不同，且 xs:token 的空白处理不可通过 whiteSpace facet 覆盖。

XML Schema xs:token 与 string 区别 XSD 中空白字符的处理规则

这是最常踩坑的地方：你用 xs:string 声明一个字段，XML 里写了 " hello world "，解析后字符串就真带前后空格和中间多个空格；换成 xs:token，它会在验证 / 解析阶段自动变成 "hello world"——即去除首尾空白，并把内部连续空白（包括制表符、换行）压缩成单个空格。

实际场景中，比如配置项、用户名、URL 片段这类「语义上不该有冗余空白」的字段，用 xs:token 更安全；而日志文本、代码片段、base64 编码块等需要保留原始空白的，必须用 xs:string。

xs:token 等价于 W3C 定义的「normalized string + trim」
xs:string 是最底层类型，不做任何空白处理
部分 XML 解析器（如 Java 的 JAXB）在绑定到 Java String 时，对 xs:token 的处理可能依赖底层 DOM 或 StAX 实现，不一定完全一致

很多人只注意空格，忽略 xs:token 同样会把 n、t、r 当作「空白字符」一并归一化。例如：

<name>Alice<tab><newline>Smith</name>

用 xs:token 声明时，最终值是 "Alice Smith"（<tab> 和 <newline> 被替换成空格）；用 xs:string 则原样保留。

如果你的 XML 数据来自用户粘贴（比如富文本编辑器导出），且内容含有意图的缩进或换行，别误用 xs:token
XSD 验证器（如 Xerces）报错 cvc-datatype-valid.1.2.1: ''is not valid with respect to the type'xs:token'，往往是因为字段值全是空白（被 trim 后为空），而 xs:token 允许空字符串，但某些业务逻辑或后续解析器会拒收空值

在 XSD 类型继承体系中，xs:token 是 xs:string 的派生类型（restriction），所以 XML 实例中，一个声明为 xs:token 的元素，其内容必须满足 xs:token 的空白规则；但反过来，声明为 xs:string 的字段可以接受任意空白形式的内容。

如果已有 XML 实例含大量冗余空白，又想加 XSD 验证，优先选 xs:string，否则验证直接失败
用 <xsd:simpleType> 自定义类型时，若基于 xs:token 再加 pattern 约束（比如邮箱格式），要注意 pattern 是在归一化后的字符串上匹配的
某些工具（如 XMLSpy）生成的 Java 类，默认把所有文本字段映射为 String，不会体现 token 和 string 的差异——这时业务层得自己补 trim 或校验

xs:token 的空白处理是硬编码行为，不受 whiteSpace facet 控制。你写：

<xs:simpleType name="myToken">   <xs:restriction base="xs:token">     <xs:whiteSpace value="preserve"/> <!-- 这行会被忽略 -->   </xs:restriction> </xs:simpleType>

这个 <xs:whiteSpace> 根本不起作用。只有在基于 xs:string 或其他原子类型（如 xs:integer）做 restriction 时，whiteSpace 才有效。

想保留空白？只能用 xs:string，别试图“覆盖”xs:token 行为
想强制非空 + 归一化？用 xs:token + <xs:minLength value="1"/>，比在代码里手动 trim 更靠前、更统一
不同解析器对「归一化时机」理解略有差异：有些在 DOM 加载时归一化，有些在 Schema 验证时，调试时注意看最终进入业务逻辑的字符串长什么样

事情说清了就结束

发表于：后端

近一天内

复制链接

转载说明：转载本网站任何内容，请按照转载方式正确书写本站原文地址。本站提供的一切软件、教程和内容信息仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。

如何用Python生成RSS 2.0 XML Feed

Spring Boot怎么读取XML配置文件 application.xml加载方法

c# dispose 和 finalizer 的区别

如何使用Golang构建Kubernetes Operator_管理自定义资源和自动化操作

SQL视图如何辅助数据库重构_旧表与新表的平滑过渡

XML Schema xs:token与string区别 XSD中空白字符的处理规则

xs:token 会自动 trim 和 normalize 空白，string 不会

xs:token 对换行符和制表符也敏感

xs:token 是 xs:string 的限制类型，不能反过来赋值

验证时 whitespace facet 对 token 无效

SQL插入大量测试数据_编写循环存储过程进行快速填充

如何在 Go 项目中合理组织 Ginkgo/Gomega 测试文件结构

Chart.js 柱状图空白问题排查与正确配置指南

SQL如何按多个条件进行分组排序_窗口函数ORDER BY多字段用法

Go 中函数类型转换与 error 接口实现原理详解

HTML怎么实现倒计时显示_HTML time剩余时间语义化【操作】

uni-app动态修改页面标题 uni-app如何设置navigationBar的title

如何识别SQL注入迹象_分析应用服务器的访问日志