MATLAB如何导入和解析XML数据 readstruct函数用法

10次阅读

readstruct 函数自 R2021a 起支持直接读 XML 为结构体,适用于标准配置类或表格型 XML;不适用深度嵌套或含命名空间的复杂 XML;常用选项包括 ’OutputFormat’、’RowNodeName’ 等。

MATLAB 如何导入和解析 XML 数据 readstruct 函数用法

MATLAB 从 R2021a 开始提供 readstruct 函数,专用于将 XML 文件直接读取为结构体(struct),比传统 xmlread + 手动解析更简洁、易用,适合大多数标准格式的配置类或表格型 XML。

支持的 XML 结构类型

该函数适用于具有清晰层级和重复元素的 XML,例如:

  • 配置文件(含属性和嵌套参数)
  • 带表头的简单数据列表(类似 CSV 的行 / 列结构)
  • 符合“一个根节点 + 多个同名子节点”模式的文档(如多个 <item></item>

不适用于深度嵌套、混合文本与子节点、或需自定义命名空间处理的复杂 XML —— 此类仍建议用 xmlread 配合 DOM 解析。

基本用法:读取 XML 到结构体

最简调用只需文件路径:

s = readstruct('data.xml');

返回结构体 s,字段名默认对应 XML 根节点下的直接子节点名。若 XML 是如下形式:

<config>   <database host="localhost" port="5432"/>   <users>     <user name="Alice" role="admin"/>     <user name="Bob" role="guest"/>   </users> </config>

s.database 是含字段 hostport 的标量结构体;s.users.user 是 1×2 结构体数组,每个含 namerole 字段。

常用选项控制解析行为

通过 Name-Value 参数微调读取结果:

  • 'OutputFormat','table':强制输出为 table(适合扁平化数据,自动展开重复字段)
  • 'RowNodeName','item':指定哪一类子节点作为“行”,用于生成 table 或结构体数组(如 XML 中有多个 <item></item>
  • 'AttributeNamePrefix','@':把属性名加上前缀(默认是 @),避免与子节点名冲突,例如 @hosthost 可区分
  • 'TextContentFieldName','text':显式命名文本内容字段(当节点含纯文本时,如 <name>John</name>s.name.text = 'John'

处理 常见问题 的小技巧

如果读出的结构体字段名含非法字符(如短横线 -),MATLAB 会自动替换为下划线(_),例如 <api-key></api-key> → 字段名 api_key;也可用 'VariableNamingRule','preserve' 保留原名(但后续访问需用圆点加引号语法:s.("api-key"))。

若 XML 包含数字字符串(如 <count>42</count>),readstruct 默认按字符串读取;需数值类型时,可后续用 str2double 转换,或借助 convertvars(配合 'OutputFormat','table' 时)批量处理列类型。

星耀云
版权声明:本站原创文章,由 星耀云 2025-12-17发表,共计1249字。
转载说明:转载本网站任何内容,请按照转载方式正确书写本站原文地址。本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。
text=ZqhQzanResources