XML的概述
XML(eXtensibleMarkup Language),扩展性标记语言,它是用来描述其他语言的语言。它允许用户设计自己的标记。XML是由W3C(WorldWide WebConsortium,互联网联合组织)于1998年2月发布的一种标准;它的前身是SGML(StandardGeneralized MarkupLanguage,标准通用置标语言)。XML产生的原因是为了补充HTML语言的不足,使网路语言更规范化、多样化。
HTML语言被称为第一代web语言,现在的版本为4.0,以后将不再更新,取而代之的是XHTML。而XHTML正是根据XML来制定的。XML有如下特点:
(1)易用性:XML可以使用多种编辑器来进行编写,包括记事本等所有的纯文本编辑器。
(2)结构性:XML是具有层次结构的标记语言,包括多层的嵌套。
(3)开放性:XML语言允许开发人员自定义标记,这使得不同的领域都可以有自己的特色方案。
(4)分离性:XML语言将数据的显示和数据内容分开保存,各自处理。使得基于XML的应用程序可以在XML文件中准确高效地搜索相关的数据内容,忽略其他不相关部分。
XML 语法XML文档结构
在开始讲解XML语法之前,先来熟悉一下XML的文档结构,代码如下:
<?xmlversion="1.0" encoding="gb2312"standalone="yes"?>
<?xml-stylesheet type="text/css"href="Book.css"?>
<!-- 下面的标签<计算机图书>就是这个XML文档的根目录 -->
<计算机图书>
<PHP>
<书名>PHP程序开发范例宝典</书名>
<价格 单位="元/本">89.00</价格>
<出版时间>2007-09-01</出版时间>
</PHP>
</计算机图书>
这就是一个XML文档的最基本的元素,包括XML声明、处理指令(PI)、注释、元素等等,下面就来一一说明。
XML 声明XML声明在文档中只能出现一次,而且必须是在第一行,连空行也不允许存在。XML声明包括了XML版本、编码等信息。示例如下:
<?xml version="1.0"encoding="gb2312" standalone="yes"?>
XML声明的各部分的含义如表所示。
处理指令
顾名思义,就是如何处理XML文档的指令。有一些XML分析器可能对XML文档的应用程序不做处理,这时可以指定应用程序按照这个指令信息来处理,然后在传给下一个应用程序。XML声明其实就是一个特殊的处理指令。处理指令的格式为:
<?处理指令名 处理执行信息?>
例如:下面创建一个处理指令,代码如下。
<?xml-stylesheettype = "text/css"href="Book.css"?>
具体含义是:
xml-stylesheet:样式表单处理指令。指明了该XML文档所使用的样式表。
type="text/css":设定了文档所使用的样式是css。
href="Book.css":设定了样式文件的地址。
注释
XML中的注释和HTML是一样的,使用“<!--”和“-->”作为开始和结束界定符。注释的用法十分简单,这里只介绍一下在使用注释时要注意的几个问题。
l 不能出现在 XML 声明之前。 l 不能出现在 XML 元素中间。如: < computer_book <!-- 这是错误的 -->> 。 l 不能出现在属性列表中。 l 不可嵌套注释。 l 注释内容可以包含“ <”“>”“&” 这些特殊字符,但不允许有“ --” 。 XML 元素元素是每个XML文档不可或缺的部分,也是文档内容的基本单元。每个XML文档至少要包含一个元素。一般的元素由三部分组成,格式如下:
<标签>数据内容</标签>
其中<标签>为元素的开始标签,</标签>是元素的结束标签,中间的数据内容是元素的值。这里要注意的是标签的写法:
l < 标签 > 和 </ 标签 > 都是成对出现的,这是 XML 严格定义的。不允许只有开始标签而没有结束标签,对于空元素,即两个标签之间没有数据,这时可以使用简短形式: < 标签 /> 。 l 英文标签名称只能由下划线“ _” 或英文字开头,中文标签名称只能使用下划线“ _” 或汉字开头。名称中只能有下划线“ _” 、连接符“ -” 、点“ .” 和冒号“ :” 几个特殊字符,也可以使用指定字符集下的合法字符。 l < 标签 > 中不能有空格。 < 标签 > 或 </ 标签 > 都是错误的。 l < 标签 > 对英文大小写很敏感。如 <name> 和 <Name> 是两个不同的标签。 XML 属性XML属性是XML元素中的内容,是可选的。XML属性和HTML中的属性在功能上十分的相似,但XML属性在格式上更加严格,使用上更加灵活。XML属性的格式为:
<标签 属性名="属性值"属性名=""…>内容</标签>
这里要注意:
l 属性名和属性值必须是成对出现的,不像 HTML 中有的属性,可以不需要值而单独存在。对于 XML 来说这是不可能的。如果没有值,写成“属性名 =""” 也可以。 l 属性值必须用引号括起来。通常使用双引号,除非属性值本身包含了双引号,这时可以用单引号来代替。使用CDATA标记
在 XML 中对于特殊字符“ >” 、“ <” 和“ &” 的输入需要使用实体引用来处理,实体引用就使用“ &…;” 的形式来代替那些特殊字符。表是 XML 中所用到的实体引用。CDATA标记的格式如下:
<![CDATA[
…
]]>
例如:创建一个XML文件,并且通过实体引用和CDATA标记来显示特殊符号,其代码如下:
<?xmlversion="1.0" encoding="GB2312"?>
<exam>
<实体引用>这里必须使用引用“<”、“>”、“&”</实体引用>
<CDATA标记>
<![CDATA[
这里可以正常输出“<”、“>”、“&”。
]]>
</CDATA标记>
</exam>
XML命名空间
命名空间通过在元素前面增加一个前缀来保证元素和属性的唯一性。它的最重要用途是用于融汇不同的XML文档。命名空间的格式为:
<标签名称 xmlns:前缀名称="URL">
例如:在创建的XML文件中,对元素<外语图书>使用命名空间,代码如下。
<?xml version="1.0"encoding="gb2312" standalone="yes"?>
<外语图书 xmlns:frn="">
<frn:English>
<frn:书名>许国璋英语</frn:书名>
<frn:价格货币种类="RMB"单位="4本">80.00</frn:价格>
<frn:出版时间>1996-05-10</frn:出版时间>
</frn:English>
</外语图书>
本文发布于:2024-01-30 20:07:50,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170661649222514.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |