Java的XML API

news/2024/7/3 9:56:58
  转载自:www.javaeye.com

IBMdeveloperWorks上有几篇非常优秀的关于Java XML API的评测文章,它们是:

http://www-900.ibm.com/developerWorks/cn/xml/x-injava/index.shtml

http://www-900.ibm.com/developerWorks/cn/xml/x-injava2/index.shtml

http://www-900.ibm.com/developerWorks/cn/xml/x-databdopt/part2/index.shtml

http://www-900.ibm.com/developerWorks/cn/xml/x-databdopt/part1/index.shtml

http://www.ibm.com/developerworks/cn/xml/x-jaxp/

http://www.ibm.com/developerworks/cn/xml/x-jaxp2/

JavaXML API这几篇文章该讲的都讲到了,我只想补充几点:

一、CrimsonXerces恩仇录

Crimson来自于Sun捐赠给ApacheProjectX项目,Xerces来自IBM捐赠给ApacheXML4J项目,结果Xerces胜出,成了Apache XML小组全力开发的XML API,而Crimon已经早就不做了,如今Xerces名满天下,到处都是在用Xerces DOMSAX解析器,只有Sun不服气,非要在JDK1.4里面使用过时的Crimson,让人感觉像是在赌气一样,真是让人可怜又可气!不过IBM发行JDK用的XML 解析器自然是Xerces

由于JDKClass Loader的优先级关系,当你采用JAXP编写XML程序的时候,即使把Xerces包引入CLASSPATHJDK还是会顽固的使用Crimson,这一点通过打开JVMverbose参数可以观察到。不过JDK也允许你采用其它的解析器,因此我们可以通过在JRE/lib/目录下建一个jaxp.properties的文件,来替换解析器,jaxp.properties内容如下:

引用

javax.xml.parsers.DocumentBuilderFactory=org.apache.xerces.jaxp.DocumentBuilderFactoryImpl
javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl

这样就可以使用Xerces,当然你必须还是要把Xerces包放到CLASSPATH下。

二、JAXP的姗姗来迟

SunXML领域总是后知后觉,等到Sun重视XML的时候,XMLAPI早就满天飞了,尤其是IBM具有非常大的领先优势。不过Sun是规范的制订者,于是参考W 3C 的标准制订了JAXP规范。JAXP不像XercesCrimon那样,它只是一个spec,本身是不做任何事情的,它的作用就是提出一个统一的接口,让其它的XML API都来遵循JAXP编程,那么用JAXP写出来的程序,底层的API可以任意切换。

具体来说JAXP包括了几个工厂类,这就是JDK1.4里面的javax.xml.parsers 包,用来寻找符合DOM标准的XML API实现类的位置;此外JAXP还包括一整套interface,这就是JDK1.4里面的org.w 3c .dom那几个包。工厂类负责加载DOM的实现类。那么加载的规则是什么呢?

我是通过阅读JAXP的源代码知道的,工厂类首先会根据java命令行传入的参数进行寻找,然后在根据JRE/lib/jaxp.properties中定义的实现类寻找,最后什么都找不到的话,就用Crimson。注意Crimons是由Bootstrap Class Loaderload的,如果你不通过上面两个方法来改变工厂的寻找顺序,那么铁定用Crimson :(

三、 DOM解析器和DOM API

当你严格采用JAXP编程的时候,是遵循W 3C Dom标准的,那么在JAXP底层你实际上可以任意切换不同的DOM实现,例如Xerces,或者Crimon,再或者其它,切换方法就是配置jaxp.properties。因此JAXP就是一些标准接口而已。

XercesCrimon也不单单是一个DOM实现那么简单,他们本身实际上也包含SAX解析器和DOM解析器。所以一个JAXP程序下面有如下层次:

引用

JAXP应用程序 -> JAXP接口 -> Xerces DOM实现 -> Xerces DOM/SAX 解析器



只要你用JAXP编程,那么你就可以切换到Crimson上来

引用

JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Crimson DOM/SAX 解析器



另外你也可以这样来做:

引用

JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Xerces DOM/SAX 解析器

 

不过如果你的程序不安装JAXP来写,那么就没有办法切换不同的DOM实现了。

四、不是标准的dom4jjdom

W 3C
DOM标准API难用的让人想撞墙,于是有一帮人开发Java专用的XML API目的是为了便于使用,这就是jdom的由来,开发到一半的时候,另一部分人又分了出来,他们有自己的想法,于是他们就去开发dom4j,形成了今天这样两个API,至于他们之间的性能,功能之比较看看上面我推荐的文章就知道了,jdom全面惨败。

jdom
相当于上面的  JAXP接口 + Xerces DOM实现部分,它本身没有解析器,它可以使用Xerces或者Crimson的解析器,就是这样:

引用

jdom应用程序 -> jdom API -> Xerces/Crimson解析器



dom4j
jdom类似,不过他自己绑定了一个叫做Alfred2的解析器,功能不是很全,但是速度很快,当没有其它的解析器的时候,dom4j将使用Alfred2解析器,如下:

引用

dom4j应用程序 -> dom4j API ->  Xerces/Crimson解析器



或者

引用

dom4j应用程序 -> dom4j API ->  Alfred2解析器



你在SF上下载的dom4j.jar是不含 Alfred2解析器的,而dom4j-full.jar包含了 Alfred2解析器,在这种情况下,实际上你什么也不需要,光是一个dom4j-full.jar就全部都包括了。

因此可以看出采用dom4j/jdom编写的应用程序,已经不具备可移植性了。

五、小插曲

Sun
JAXP标准的制订者,甚至很执著的在JDK1.4里面绑定Crimson DOM实现和解析器,然后可笑的是,Sun自己的JAXM RI竟然不是用JAXP写出来的,而是dom4j,制订标准让大家遵守,自己却监守自盗,这未免太说不过去了吧!

BTW: Hibernate
也用的是dom4j来读取XML配置文件,如今已经越来越多的程序纷纷采用dom4j,如果你不是那么在乎可移植性,我强烈建议你采用dom4j

 


http://www.niftyadmin.cn/n/4411455.html

相关文章

使用deepke时,遇到ModuleNotFoundError: No module named ‘google.protobuf‘解决方案

第一次使用deepke,运行示例的run.py时出现这样的错误: ModuleNotFoundError: No module named google.protobuf 网络上给出的答案是: pip uninstall protobuf pip uninstall google pip install google pip install protobuf 我运行之后都没…

java 高级特性

1,关于jdk内存泄漏的问题http://blogs.sun.com/fkieviet/entry/classloader_leaks_the_dreaded_java2.关于classloader的加载http://www.theserverside.com/tt/articles/article.tss?lClassLoading

论文阅读《Cross-Lingual Contrastive Learning for Fine-Grained Entity Typing for Low-Resource Languages》

Cross-Lingual Contrastive Learning for Fine-Grained Entity Typing for Low-Resource Languages 论文内容简介: 细粒度实体类型分析(Fine-grained entity typing,简称FGET)旨在将实体命名事件划分为细粒度的实体类型,这对于实体相关的NL…

简单的neo4j三元组增量插入-通过py2neo实现

今天写了一个简单增量插入三元组的程序 1、查找实体类型对应的实例,放入list中,用于实例查重: # 查找实体类型对应实例,返回list def get_all_entities_of_ent_typ(graph, ent_typ):matcher NodeMatcher(graph)ent_list list(…

Steve Jobs的十句金玉良言

http://blog.csdn.net/zero8500/archive/2008/09/27/2987613.aspx

论文阅读《KnowPrompt: Knowledge-aware Prompt-tuning withSynergistic Optimization for Relation Extractio》

论文链接KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization for Relation Extraction Introduction 现有关系抽取存在的问题: 基于微调的关系抽取方法: (1)性能严重依赖耗时和劳动密集型的注释数据,难以很好地泛…

IE浏览器无法查看源文件的8大原因

问:无论是使用Outlook还是IE,点击鼠标右键,在弹出的快捷菜单中都会有“查看源文件”这一选项,奇怪的是,在我的电脑上竟然无法显示该邮件或网页的源文件,虽然这并没有影响到该软件的正常使用。请问&#xff…

论文阅读《Knowledge Collaborative Fine-tuning for Low-resource Knowledge GraphCompletion》

论文链接 基于知识协同微调的低资源知识图谱补全方法 2022年3月发表于软件学报 是浙大prompt系列的一个延续 本文之前的工作: AdaPrompt: Adaptive Prompt-based Finetuning for Relation Extraction 本文之后的工作: Knowledge-aware Prompt-tun…