【JAVA XML 探秘】DOM、SAX、StAX:揭秘 Java 中 XML 解析技术的终极指南!

简介: 【8月更文挑战第25天】本文详细探讨了Java中三种主流的XML解析技术:DOM、SAX与StAX。DOM将XML文档转换为树状结构,便于全方位访问和修改;SAX采取事件驱动模式,适用于大型文件的顺序处理;StAX则兼具DOM和SAX的优点,支持流式处理和随机访问。文中提供了每种技术的示例代码,帮助读者理解如何在实际项目中应用这些解析方法。

XML(Extensible Markup Language,可扩展标记语言)是一种用于存储和传输数据的标准格式。在 Java 中,XML 被广泛应用于配置文件、数据交换、Web 服务等领域。本文将以议论文的形式,详细介绍 Java 中常用的几种 XML 解析技术:DOM、SAX 和 StAX,并通过示例代码展示这些技术的使用方法。

DOM 解析

DOM(Document Object Model,文档对象模型)是一种将 XML 文档转化为树形结构的方法。DOM 解析器一次性读取整个 XML 文档,并将其转化为内存中的对象模型,使得开发者可以方便地访问和修改文档中的任何部分。

示例代码

import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

public class DOMParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(inputFile);
            doc.getDocumentElement().normalize();

            System.out.println("Root element: " + doc.getDocumentElement().getNodeName());

            NodeList nList = doc.getElementsByTagName("person");

            for (int temp = 0; temp < nList.getLength(); temp++) {
   
                Node nNode = nList.item(temp);

                System.out.println("\nCurrent Element: " + nNode.getNodeName());

                if (nNode.getNodeType() == Node.ELEMENT_NODE) {
   
                    Element eElement = (Element) nNode;

                    System.out.println("Name: " + eElement.getElementsByTagName("name").item(0).getTextContent());
                    System.out.println("Age: " + eElement.getElementsByTagName("age").item(0).getTextContent());
                    System.out.println("Country: " + eElement.getElementsByTagName("country").item(0).getTextContent());
                }
            }
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

SAX 解析

SAX(Simple API for XML,XML 简单 API)是一种事件驱动型的解析方式。SAX 解析器在读取 XML 文档的过程中触发一系列事件,例如开始文档、开始标签、结束标签等,开发者可以通过实现相应的回调方法来处理这些事件。

示例代码

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class SAXParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser saxParser = factory.newSAXParser();

            DefaultHandler handler = new DefaultHandler() {
   
                boolean bName = false;
                boolean bAge = false;
                boolean bCountry = false;

                public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
   
                    if (qName.equalsIgnoreCase("name")) {
   
                        bName = true;
                    } else if (qName.equalsIgnoreCase("age")) {
   
                        bAge = true;
                    } else if (qName.equalsIgnoreCase("country")) {
   
                        bCountry = true;
                    }
                }

                public void endElement(String uri, String localName, String qName) throws SAXException {
   
                    if (qName.equalsIgnoreCase("name")) {
   
                        bName = false;
                    } else if (qName.equalsIgnoreCase("age")) {
   
                        bAge = false;
                    } else if (qName.equalsIgnoreCase("country")) {
   
                        bCountry = false;
                    }
                }

                public void characters(char ch[], int start, int length) throws SAXException {
   
                    if (bName) {
   
                        System.out.println("Name: " + new String(ch, start, length));
                    } else if (bAge) {
   
                        System.out.println("Age: " + new String(ch, start, length));
                    } else if (bCountry) {
   
                        System.out.println("Country: " + new String(ch, start, length));
                    }
                }
            };

            saxParser.parse(inputFile, handler);
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

StAX 解析

StAX(Streaming API for XML,流式 XML API)是一种流式解析方式,它结合了 DOM 和 SAX 的优点。StAX 解析器可以逐个事件地读取 XML 文档,这使得它可以处理非常大的 XML 文件,而且不需要一次性加载整个文档到内存中。

示例代码

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamReader;
import java.io.File;
import java.io.FileInputStream;

public class StAXParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            FileInputStream fis = new FileInputStream(inputFile);
            XMLInputFactory factory = XMLInputFactory.newInstance();
            XMLStreamReader reader = factory.createXMLStreamReader(fis);

            while (reader.hasNext()) {
   
                int event = reader.next();

                switch (event) {
   
                    case XMLStreamConstants.START_ELEMENT:
                        if ("person".equals(reader.getLocalName())) {
   
                            System.out.println("\nCurrent Element: " + reader.getLocalName());
                        }
                        break;
                    case XMLStreamConstants.CHARACTERS:
                        if ("name".equals(reader.getLocalName())) {
   
                            System.out.println("Name: " + reader.getText());
                        } else if ("age".equals(reader.getLocalName())) {
   
                            System.out.println("Age: " + reader.getText());
                        } else if ("country".equals(reader.getLocalName())) {
   
                            System.out.println("Country: " + reader.getText());
                        }
                        break;
                    case XMLStreamConstants.END_ELEMENT:
                        break;
                }
            }

            reader.close();
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

讨论

每种解析方式都有其适用场景:

  • DOM:适用于需要随机访问文档内容的情况。由于需要一次性加载整个文档到内存中,因此不适合处理大型文件。
  • SAX:适用于只需要顺序读取文档的部分内容的情况。由于采用事件驱动的方式,因此适合处理大型文件,但不能随机访问文档内容。
  • StAX:结合了 DOM 和 SAX 的优点,既可以处理大型文件,又允许随机访问文档内容。

总结

通过上述议论文,我们可以了解到 Java 中 XML 解析的三种主要技术:DOM、SAX 和 StAX。每种技术都有其独特的优势和适用场景。无论是在日常开发还是面试准备中,熟悉这些 XML 解析技术都是非常重要的。

相关文章
|
2月前
|
监控 Cloud Native Java
Quarkus 云原生Java框架技术详解与实践指南
本文档全面介绍 Quarkus 框架的核心概念、架构特性和实践应用。作为新一代的云原生 Java 框架,Quarkus 旨在为 OpenJDK HotSpot 和 GraalVM 量身定制,显著提升 Java 在容器化环境中的运行效率。本文将深入探讨其响应式编程模型、原生编译能力、扩展机制以及与微服务架构的深度集成,帮助开发者构建高效、轻量的云原生应用。
267 44
|
2月前
|
安全 Java API
Java Web 在线商城项目最新技术实操指南帮助开发者高效完成商城项目开发
本项目基于Spring Boot 3.2与Vue 3构建现代化在线商城,涵盖技术选型、核心功能实现、安全控制与容器化部署,助开发者掌握最新Java Web全栈开发实践。
308 1
|
3月前
|
安全 Java 编译器
new出来的对象,不一定在堆上?聊聊Java虚拟机的优化技术:逃逸分析
逃逸分析是一种静态程序分析技术,用于判断对象的可见性与生命周期。它帮助即时编译器优化内存使用、降低同步开销。根据对象是否逃逸出方法或线程,分析结果分为未逃逸、方法逃逸和线程逃逸三种。基于分析结果,编译器可进行同步锁消除、标量替换和栈上分配等优化,从而提升程序性能。尽管逃逸分析计算复杂度较高,但其在热点代码中的应用为Java虚拟机带来了显著的优化效果。
95 4
|
3月前
|
Java API Maven
2025 Java 零基础到实战最新技术实操全攻略与学习指南
本教程涵盖Java从零基础到实战的全流程,基于2025年最新技术栈,包括JDK 21、IntelliJ IDEA 2025.1、Spring Boot 3.x、Maven 4及Docker容器化部署,帮助开发者快速掌握现代Java开发技能。
708 1
|
4月前
|
人工智能 Java
Java多任务编排技术
JDK 5引入Future接口实现异步任务处理,但获取结果不够灵活。Java 8新增CompletableFuture,实现异步任务编排,支持流式处理、多任务组合及异常处理,提升执行效率与代码可读性,简化并发编程复杂度。
102 0
|
3月前
|
Java 测试技术 API
2025 年 Java 开发者必知的最新技术实操指南全览
本指南涵盖Java 21+核心实操,详解虚拟线程、Spring Boot 3.3+GraalVM、Jakarta EE 10+MicroProfile 6微服务开发,并提供现代Java开发最佳实践,助力开发者高效构建高性能应用。
520 4
|
2月前
|
安全 Cloud Native Java
Java 模块化系统(JPMS)技术详解与实践指南
本文档全面介绍 Java 平台模块系统(JPMS)的核心概念、架构设计和实践应用。作为 Java 9 引入的最重要特性之一,JPMS 为 Java 应用程序提供了强大的模块化支持,解决了长期存在的 JAR 地狱问题,并改善了应用的安全性和可维护性。本文将深入探讨模块声明、模块路径、访问控制、服务绑定等核心机制,帮助开发者构建更加健壮和可维护的 Java 应用。
221 0
|
3月前
|
JavaScript 安全 前端开发
Java开发:最新技术驱动的病人挂号系统实操指南与全流程操作技巧汇总
本文介绍基于Spring Boot 3.x、Vue 3等最新技术构建现代化病人挂号系统,涵盖技术选型、核心功能实现与部署方案,助力开发者快速搭建高效、安全的医疗挂号平台。
194 3
|
4月前
|
存储 Java Linux
操作系统层面视角下 Java IO 的演进路径及核心技术变革解析
本文从操作系统层面深入解析Java IO的演进历程,涵盖BIO、NIO、多路复用器及Netty等核心技术。分析各阶段IO模型的原理、优缺点及系统调用机制,探讨Java如何通过底层优化提升并发性能与数据处理效率,全面呈现IO技术的变革路径与发展趋势。
90 2
|
4月前
|
安全 Java 微服务
Java 最新技术和框架实操:涵盖 JDK 21 新特性与 Spring Security 6.x 安全框架搭建
本文系统整理了Java最新技术与主流框架实操内容,涵盖Java 17+新特性(如模式匹配、文本块、记录类)、Spring Boot 3微服务开发、响应式编程(WebFlux)、容器化部署(Docker+K8s)、测试与CI/CD实践,附完整代码示例和学习资源推荐,助你构建现代Java全栈开发能力。
475 0

推荐镜像

更多
  • DNS