标记语言
标记语言,也称置标语言,是一种将文本(Text)以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码。与文本相关的其他信息(包括例如文本的结构和表示信息等)与原来的文本结合在一起,但是使用标记(markup)进行标识。
标记语言简介[ ]
标记语言,也称置标语言,是一种将文本(Text)以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码。与文本相关的其他信息(包括例如文本的结构和表示信息等)与原来的文本结合在一起,但是使用标记(markup)进行标识。当今广泛使用的置标语言是超文本置标语言(HyperText Markup Language,HTML)和可扩展置标语言 (eXtensible Markup Language,XML)。置标语言广泛应用于网页和网络应用程序。标记最早用于出版业,是作者、编辑以及出版商之间用于描述出版作品的排版格式所使用的。
标记语言分类[ ]
- 标识性的置标语言
标识性的置标语言 (Presentational markup)是在编码过程中,标记文档的结构信息。例如,在文本文件中, 文件的标题可能需要用特定的格式表示(居中,放大等),这样我们就需要标记文件的标题。字处理以及桌面出版产品有时候能够自动推断出这类的结构信息,但是绝大多数的,像Wiki这样的纯文本编辑器还不能解决这个问题。
- 过程性标识
过程性置标语言(Procedural markup) 一般都专门于文字的表达,但通常对于文本编辑者可见,并且能够被软件依其出现顺序依次解读 。 为了格式化一个标题,在标题文本之前,会紧接着插入一系列的格式标识符,以指示计算机转换到居中的显示模式,同时加大及加粗字体。在标题文本之后,会紧接缀上格式中止标识; 对于更高级的系统宏命令或这堆栈模式会让这一过程的实现方式更加丰富 。大多是情况下, 过程性置标能力包含有一个Turing-complete编程语言。 过程性置标语言的范例有:nroff, troff, TeX, Lout 以及 PostScript. 过程性置标语言被广泛应用在专业出版领域, 专业的出版商会根据要求使用不同的指标语言已达到出版要求.
- 描述性标识
历史
“置标(markup)”这个词来源自传统出版业的“标记”一个手稿,也就是在原稿的边缘加注一些符号来指示打印上的要求。 长久以来,这个工作都是由专门的人("markup men" )以及校对人来进行,对原稿标志出使用什么样的字体,字型以及字号,然后再将原稿交给其他人进行手工的排版工作。
GenCode
TeX
主条目:TeX TeX是一个由美国电脑教授高德纳(Donald E. Knuth)编写的功能强大的排版软件。它在学术界十分流行,特别是数学、物理学和计算机科学界。TeX被普遍认为是一个很好的排版工具,特别是在处理复杂的数学公式时。利用诸如是LaTeX等终端软件,TeX就能够排版出精美的文本。
SGML SGML是一种专门的置标语言,被用作编写《牛津英语词典》的电子版本。由于SGML的复杂,导致难以普及。
HTML
主条目:HTML 超文件标示语言(英文:HyperText Markup Language,简称为HTML)是为网页创建和其它可在网页浏览器中看到的信息设计的一种标记语言。
XML
主条目:XML 可扩展标记语言(Extensible Markup Language,简称XML),又称可扩展置标语言,是一种标记语言。置标指电脑所能理解的信息符号,通过此种标记,电脑之间可以处理包含各种信息的文章等。
XHTML
主条目:XHTML 可延伸超文件标示语言(eXtensible HyperText Markup Language,XHTML),是一种标记语言,表现方式与超文本标记语言(HTML)类似,不过语法上更加严格。
其他基于XML的应用.
还有其他一些基于XML的应用,比如RDF, XForms, DocBook, SOAP以及Web Ontology Language (OWL)。具体可以参见XML标记语言列表.
特征
其他应用
XAML(Extensible Application Markup Language),基于XML语言,在微软WPF(Windows Presentation Foundation)中使用。
标记语言历史[ ]
标记语言(markup language),用一系列约定好的标记来对电子文档进行标记,以实现对电子文档的语义、结构、及格式的定义。这些标记必须很容易的和内容区分,并且易于识别。标记语言的发展如下:
GML(1969)
|
SGML(1985)
|
XML(1998) 、、、、、、、HTML(1993)
|——————|——|———|——|
MathML、WML、SVG、CML、XHTML
为了促进数据交换和操作,在20世纪60年代,通过IBM格公司研究人员的杰出工作,得出了重要的结论:要提高系统的移植性,必须采用一种通用的文档格式,这种文档的格式必须遵守特定的规则。这也就是创建GML (Generalized Markup Language,通用标记语言)的指导原则,从人们所产生的将文件结构化为标准的格式的动机出发,IBM创建了GML。
在标记语言的概念达成共识的基础上,IBM公司的研究人员Charles Goldfarb带领的开发团队完善着GML,将其称为SGML(Standard Generalized Markup Language,标记通用标记语言),SGML成为了IBM内部格式化和维护合法化文件的手段。后来被拓展和修改,作为一种全面的信息标准以适应工业范围的广泛应用,1986年,SGML被国际标准化组织(ISO)所采纳。
他的功能非常强大,但是非常复杂,需要许多昂贵的软件配合运行,因此在很长一段时间内没有被推广。
1989年,欧洲粒子物理实验室(CERT)的研究员Tim Berners-Lee和Anders Berglund共同创建了一种基于标记的语言HTML,他可看做SGML的简单应用,开始时仅仅提供一种对静态文本的信息显示的方法,后来越来越多的标签产生,两大浏览器厂商微软和网景格式,甚至创建了自己的产品的兼容标签,使HTML变得臃肿不堪,兼容性不好。
1996年人们开始致力于描述一个新的标记语言,它是一种在WEB中应用SGML的灵活性和强大功能的方法,W3C(World Wide Web Consortium,全球万维网联盟--领导万维网,制定其公共的协议,促进万维网的发展并确保其互操作性的国际组织)专门成立了专家小组以从事这项工作。1998.2,w3c批准了XML1.0规范。XML(eXtensible Markup Language,可扩展的标记语言),具备SGML的核心特性,但简洁,他的内容甚至不到SGML的十分之一。
其他应用[ ]
XAML(Extensible Application Markup Language),基于XML语言,在微软WPF(Windows Presentation Foundation)中使用。