readstruct 函数自 R2021a 起支持直接读 XML 为结构体,适用于标准配置类或表格型 XML;不适用深度嵌套或含命名空间的复杂 XML;常用选项包括 ’OutputFormat’、’RowNodeName’ 等。

MATLAB 从 R2021a 开始提供 readstruct 函数,专用于将 XML 文件直接读取为结构体(struct),比传统 xmlread + 手动解析更简洁、易用,适合大多数标准格式的配置类或表格型 XML。
支持的 XML 结构类型
该函数适用于具有清晰层级和重复元素的 XML,例如:
- 配置文件(含属性和嵌套参数)
- 带表头的简单数据列表(类似 CSV 的行 / 列结构)
- 符合“一个根节点 + 多个同名子节点”模式的文档(如多个
<item></item>)
不适用于深度嵌套、混合文本与子节点、或需自定义命名空间处理的复杂 XML —— 此类仍建议用 xmlread 配合 DOM 解析。
基本用法:读取 XML 到结构体
最简调用只需文件路径:
s = readstruct('data.xml');
返回结构体 s,字段名默认对应 XML 根节点下的直接子节点名。若 XML 是如下形式:
<config> <database host="localhost" port="5432"/> <users> <user name="Alice" role="admin"/> <user name="Bob" role="guest"/> </users> </config>
则 s.database 是含字段 host 和 port 的标量结构体;s.users.user 是 1×2 结构体数组,每个含 name 和 role 字段。
常用选项控制解析行为
通过 Name-Value 参数微调读取结果:
-
'OutputFormat','table':强制输出为 table(适合扁平化数据,自动展开重复字段) -
'RowNodeName','item':指定哪一类子节点作为“行”,用于生成 table 或结构体数组(如 XML 中有多个<item></item>) -
'AttributeNamePrefix','@':把属性名加上前缀(默认是@),避免与子节点名冲突,例如@host和host可区分 -
'TextContentFieldName','text':显式命名文本内容字段(当节点含纯文本时,如<name>John</name>→s.name.text = 'John')
处理 常见问题 的小技巧
如果读出的结构体字段名含非法字符(如短横线 -),MATLAB 会自动替换为下划线(_),例如 <api-key></api-key> → 字段名 api_key;也可用 'VariableNamingRule','preserve' 保留原名(但后续访问需用圆点加引号语法:s.("api-key"))。
若 XML 包含数字字符串(如 <count>42</count>),readstruct 默认按字符串读取;需数值类型时,可后续用 str2double 转换,或借助 convertvars(配合 'OutputFormat','table' 时)批量处理列类型。