XML
XML(eXtensible Markup Language的缩写),意为可扩展的标记语言。与HTML相似,XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。
XML的历史[ ]
1996年万维网协会(或者叫W3C)开始设计一种可扩展的标记语言,使其能够将SGML的灵活性和强大功能与已经被广泛采用的HTML结合起来。这种后来变成XML的语言继承了SGML的规范,而且实际上就是后者的一个子集。从SGML入手使得该设计小组能够将精力集中在简化已有的成果上。SGML已经提供了一种可以无限扩展的语言,它允许任何人能够根据自己的需要加以扩充。XML之所以要较SGML更为简化,很大程度上是出于易用性的考虑:人们对标记的读写过程应该使用现有的、简便通用的工具,同时,我们也应当简化计算机对文档和数据交换的处理。由于有太多的可选功能,SGML变得过于复杂,以至于很难编写出针对这种语言的普通解释器,而XML的解释器则简单得多。此外,XML使得现有的Internet协议和软件更为协调,从而简化了数据处理和传输。作为一个不错的SGML子集,XML还保持了对现有的面向SGML的系统的向下兼容性,这样,用XML标记过的数据就仍然可以在 这些系统中使用,为基于SGML的行业节省了大笔的改造费用,同时,与Web的结合也使得它们更便于被访问。
1998年2月,XML 1.0 成为了W3C 的推荐标准。包括Extended Backus-Naur Form (EBNF) 中语法标识在内的这个正式的规范可以很容易地从W3C 的Web站点(http://www.w3c.org/TR/REC-xml)上得到;此外,XML规范的制定者之一Tim Bray 还在http://www.xml.com/axml/testaxml.htm 上提供了一个有着非常不错的注解的版本。在http://www.ucc.ie/xml/上,由Peter Flynn 等人代表W3C 的XML 研究组维护的一个XML 1.0FAQ 还提供了到其他与XML 相关的主题的链接。XML是一种界定文本数据的简便而标准的方法。它曾经被人称作“Web上的ASCII码”。就好像你可以使用自己喜爱的编程语言来创建任何一种数据结构,然后同其他人在其他计算平台上使用的其他语言来共享一样。XML的标记用来说明你所描述的概念,而属性则用来控制它们的结构。所以,你可以定义自己所设计出的语法并同其他人共享。
XML的特点[ ]
- 使用有意义的标记(TAG)
HTML:给浏览器读取,不能传达数据的语义。
XML:具有语义。
- 数据的语义与显示方式分开
HTML:决定数据显示方式的语言。
XML:描述数据内容的语言,本身并不决定数据该如何显示,数据的显示由XSL决定。
- 可自定义的标记
HTML:标记由少数权威团体制定,种类有限且不能随意添加。
XML:可由用户按需要增加标记。如数学标记语言MATHML、财经标记语言FPML、电子商务标记语言EBXML等。
- 严格的语法控制
HTML:语法规则比较多元化,具有较大灵活性。文件结构比较松散,不能很容易的转换为其他类型格式,比较难用程序来做大量而有效的处理,数据再利用的潜力大为降低。
XML:对语法有严格的要求,所有XML的文件都必须经过严格的“验证”过程才算完成,文件格式容易转换。
XML的优势[ ]
XML最大的优势在于对各种数据的管理。任何系统都可以通过XML的解析器来读取XML数据,因此它的数据可以通行各处,而不用担心系统不支持的问题。
- 数据的检索:
Internet上主要的数据检索方式:分类检索和全文检索。
XML:在语义标记作为搜索索引;在文件中截取关键部分。所有标记内的数据都可视为一个元素,而每一个元素都可以作为数据的索引。
- 数据的显示:
XML将数据保存的格式与数据显示的方式分开,使得XML文件可以轻易地更换数据显示的方式,仅需改变XSL的设置,用户就可以将同一数据制作成HTML、PDF、WML(Wireless Markup Language)、HDML(Hand-Held Device Markup Language)等不同格式,供不同的硬件显示。
- 数据的交换:
XML语法简单,可以被所有的机器解读,又可以在各种平台上使用,使得XML有潜力成为一个通行四海皆准的标记语言。
XML应用范围[ ]
XML的应用主要有:内容管理(Content Management)、电子邮件的收发与管理、智能型日历、个性化信息服务、电子商务。