XML Schema 描述了 XML文档的结构。
在此教程中,你将学习如何在应用程序中读取和创建 XML Schema 语言,XML Schema 为何比 DTD 更加强大,以及如何在您的应用程序中使用 XML Schema。
在 W3CSchool中,我们学习完整的 XML Schema 元素。
XML Schema 参考手册
XML Schema 是基于 XML 的 DTD 替代者。
XML Schema 可描述 XML 文档的结构。
XML Schema 语言也可作为 XSD(XML Schema Definition)来引用。
在继续学习之前,您需要对下面的知识有基本的了解:
如果您希望首先学习这些项目,请在 首页 访问这些教程。
XML Schema 的作用是定义 XML 文档的合法构建模块,类似 DTD。
我们认为 XML Schema 很快会在大部分网络应用程序中取代 DTD。
XML Schema 在 2001 年 5 月 2 日成为 W3C 标准。
您可以在我们的《W3C 教程》中获得更多有关 XML Schema 标准的信息。
既然 XML Schemas 的作用与 DTD(文档类型定义)相同,那么为什么要使用 XML Schemas 呢?
XML Schema 比 DTD 更强大。
XML Schema 最重要的能力之一就是对数据类型的支持。
编者注:数据约束,或称 facets,是 XML Schema 原型中的一个术语,中文可译为"面",用来约束数据类型的容许值。
另一个关于 XML Schema 的重要特性是,它们由 XML 编写。
当数据从发送方被发送到接受方时,其要点是双方应有关于内容的相同的"期望值"。
通过 XML Schema,发送方可以用一种接受方能够明白的方式来描述数据。
一种数据,比如 "03-11-2004",在某些国家被解释为11月3日,而在另一些国家为当作3月11日。
但是一个带有数据类型的 XML 元素,比如:<date type="date">2004-03-11</date>,可确保对内容一致的理解,这是因为 XML 的数据类型 "date" 要求的格式是 "YYYY-MM-DD"。
XML Schema 是可扩展的,因为它们由 XML 编写。
我们把符合 XML 语法的文档称为形式良好的 XML 文档,比如:
即使文档的形式良好,仍然不能保证它们不会包含错误,并且这些错误可能会产生严重的后果。
请考虑下面的情况:您订购的了 5 打激光打印机,而不是 5 台。通过 XML Schema,大部分这样的错误会被您的验证软件捕获到。
在下一节内容中,我们将开始学习使用 XML Schema。
XML 文档可对 DTD 或 XML Schema 进行引用。
请看这个名为 "note.xml" 的 XML 文档:
下面这个例子是名为 "note.dtd" 的 DTD 文件,它对上面那个 XML 文档( "note.xml" )的元素进行了定义:
第 1 行定义 note 元素有四个子元素:"to, from, heading, body"。
第 2-5 行定义了 to, from, heading, body 元素的类型是 "#PCDATA"。
下面这个例子是一个名为 "note.xsd" 的 XML Schema 文件,它定义了上面那个 XML 文档( "note.xml" )的元素:
note 元素是一个复合类型,因为它包含其他的子元素。其他元素 (to, from, heading, body) 是简易类型,因为它们没有包含其他元素。您将在下面的章节学习更多有关复合类型和简易类型的知识。
此文件包含对 DTD 的引用:
此文件包含对 XML Schema 的引用:
在下一节的内容中,我们将介绍 XML 的 schema 元素。
本节介绍 schema 元素的定义与相关的使用。
schema 元素定义 schema 的根元素。
属性 | 描述 |
---|---|
id | 可选。规定该元素的唯一的 ID。 |
attributeFormDefault | 可选。在该 schema 的目标命名空间中声明的属性的形式。该值必须是下列字符串之一: "qualified" 或 "unqualified"。 默认值为 "unqualified"。
|
elementFormDefault | 可选。在该 schema 的目标命名空间中声明的元素的形式。该值必须是下列字符串之一: "qualified" 或 "unqualified"。 默认值为 "unqualified"。
|
blockDefault | 可选。规定在目标命名空间中 element 和 complexType 元素上的 block 属性的默认值。block 属性防止具有指定派生类型的复杂类型(或元素)被用来代替继承的复杂类型(或元素)。该值可以包含 #all 或者一个列表,该列表是 extension、restriction 或 substitution 的子集:
|
finalDefault | 可选。规定在该架构的目标命名空间中 element、simpleType 和 complexType 元素的 final 属性的默认值。final 属性防止 element、simpleType 或 complexType 元素的指定的派生类型。对于 element 和 complexType 元素,该值可以包含 #all 或一个列表,该列表是 extension 或 restriction 的子集。 对于 simpleType 元素,该值还可以包含 list 和 union:
|
targetNamespace | 该 schema 的命名空间的 URI 引用。还可以分配该命名空间的前缀。如果没有分配任何前缀,则该命名空间的 schema 组件可以和非限定的引用一起使用。 |
version | 可选。规定 schema 的版本。 |
xmlns | 规定在此 schema 中使用的一个或多个命名空间的 URI 引用。如果没有分配前缀,该命名空间的 schema 组件可与未限制的引用使用。 |
any attributes | 可选。规定带有 non-schema 命名空间的任何其他属性。 |
在本例中,http://www.w3.org/2001/XMLSchema 命名空间中 schema 组件 (element name, type) 是未限制的,而 //www.51coolma.cn/51coolmaschema (mystring) 是通过 wsc 前缀限制的:
XML Schema 可定义 XML 文件的元素。
简易元素指那些只包含文本的元素。它不会包含任何其他的元素或属性。
简易元素指那些仅包含文本的元素。它不会包含任何其他的元素或属性。
不过,"仅包含文本"这个限定却很容易造成误解。文本有很多类型。它可以是 XML Schema 定义中包括的类型中的一种(布尔、字符串、数据等等),或者它也可以是您自行定义的定制类型。
您也可向数据类型添加限定(即 facets),以此来限制它的内容,或者您可以要求数据匹配某种特定的模式。
定义简易元素的语法:
此处 xxx 指元素的名称,yyy 指元素的数据类型。XML Schema 拥有很多内建的数据类型。
这是一些 XML 元素:
这是相应的简易元素定义:
简易元素可拥有指定的默认值或固定值。
当没有其他的值被规定时,默认值就会自动分配给元素。
在下面的例子中,缺省值是 "red":
固定值同样会自动分配给元素,并且您无法规定另外一个值。
在下面的例子中,固定值是 "red":
提示:简易元素无法拥有属性。假如某个元素拥有属性,它就会被当作某种复合类型。但是属性本身总是作为简易类型被声明的,这将在下一节内容中说明。
所有的属性均作为简易类型来声明。
也就是说:有属性的元素总是被定义为复合的类型。
简易元素无法拥有属性。假如某个元素拥有属性,它就会被当作某种复合类型。但是属性本身总是作为简易类型被声明的。
定义属性的语法是
在此处,xxx 指属性名称,yyy 则规定属性的数据类型。XML Schema 拥有很多内建的数据类型。
这是带有属性的 XML 元素:
这是对应的属性定义:
属性可拥有指定的默认值或固定值。
当没有其他的值被规定时,默认值就会自动分配给元素。
在下面的例子中,缺省值是 "EN":
固定值同样会自动分配给元素,并且您无法规定另外的值。
在下面的例子中,固定值是 "EN":
在缺省的情况下,属性是可选的。如需规定属性为必选,请使用 "use" 属性:
当 XML 元素或属性拥有被定义的数据类型时,就会向元素或属性的内容添加限定。
假如 XML 元素的类型是 "xs:date",而其包含的内容是类似 "Hello World" 的字符串,元素将不会(通过)验证。
通过 XML schema,您也可向您的 XML 元素及属性添加自己的限定。这些限定被称为 facet(编者注:意为(多面体的)面,可译为限定面)。您会在下一节了解到更多有关 facet 的知识。
限定(restriction)用于为 XML 元素或者属性定义可接受的值。对 XML 元素的限定被称为 facet。
下面的例子定义了带有一个限定且名为 "age" 的元素。age 的值不能低于 0 或者高于 120:
如需把 XML 元素的内容限制为一组可接受的值,我们要使用枚举约束(enumeration constraint)。
下面的例子定义了带有一个限定的名为 "car" 的元素。可接受的值只有:Audi, Golf, BMW:
上面的例子也可以被写为:
注意: 在这种情况下,类型 "carType" 可被其他元素使用,因为它不是 "car" 元素的组成部分。
如需把 XML 元素的内容限制定义为一系列可使用的数字或字母,我们要使用模式约束(pattern constraint)。
下面的例子定义了带有一个限定的名为 "letter" 的元素。可接受的值只有小写字母 a - z 其中的一个:
下一个例子定义了带有一个限定的名为 "initials" 的元素。可接受的值是大写字母 A - Z 其中的三个:
下一个例子也定义了带有一个限定的名为 "initials" 的元素。可接受的值是大写或小写字母 a - z 其中的三个:
下一个例子定义了带有一个限定的名为 "choice 的元素。可接受的值是字母 x, y 或 z 中的一个:
下一个例子定义了带有一个限定的名为 "prodid" 的元素。可接受的值是五个阿拉伯数字的一个序列,且每个数字的范围是 0-9:
下面的例子定义了带有一个限定的名为 "letter" 的元素。可接受的值是 a - z 中零个或多个字母:
下面的例子定义了带有一个限定的名为 "letter" 的元素。可接受的值是一对或多对字母,每对字母由一个小写字母后跟一个大写字母组成。举个例子,"sToP"将会通过这种模式的验证,但是 "Stop"、"STOP" 或者 "stop" 无法通过验证:
下面的例子定义了带有一个限定的名为 "gender" 的元素。可接受的值是 male 或者 female:
下面的例子定义了带有一个限定的名为 "password" 的元素。可接受的值是由 8 个字符组成的一行字符,这些字符必须是大写或小写字母 a - z 亦或数字 0 - 9:
如需规定对空白字符(whitespace characters)的处理方式,我们需要使用 whiteSpace 限定。
下面的例子定义了带有一个限定的名为 "address" 的元素。这个 whiteSpace 限定被设置为 "preserve",这意味着 XML 处理器不会移除任何空白字符:
这个例子也定义了带有一个限定的名为 "address" 的元素。这个 whiteSpace 限定被设置为 "replace",这意味着 XML 处理器将移除所有空白字符(换行、回车、空格以及制表符):
这个例子也定义了带有一个限定的名为 "address" 的元素。这个 whiteSpace 限定被设置为 "collapse",这意味着 XML 处理器将移除所有空白字符(换行、回车、空格以及制表符会被替换为空格,开头和结尾的空格会被移除,而多个连续的空格会被缩减为一个单一的空格):
如需限制元素中值的长度,我们需要使用 length、maxLength 以及 minLength 限定。
本例定义了带有一个限定且名为 "password" 的元素。其值必须精确到 8 个字符:
这个例子也定义了带有一个限定的名为 "password" 的元素。其值最小为 5 个字符,最大为 8 个字符:
限定 | 描述 |
---|---|
enumeration | 定义可接受值的一个列表 |
fractionDigits | 定义所允许的最大的小数位数。必须大于等于0。 |
length | 定义所允许的字符或者列表项目的精确数目。必须大于或等于0。 |
maxExclusive | 定义数值的上限。所允许的值必须小于此值。 |
maxInclusive | 定义数值的上限。所允许的值必须小于或等于此值。 |
maxLength | 定义所允许的字符或者列表项目的最大数目。必须大于或等于0。 |
minExclusive | 定义数值的下限。所允许的值必需大于此值。 |
minInclusive | 定义数值的下限。所允许的值必需大于或等于此值。 |
minLength | 定义所允许的字符或者列表项目的最小数目。必须大于或等于0。 |
pattern | 定义可接受的字符的精确序列。 |
totalDigits | 定义所允许的阿拉伯数字的精确位数。必须大于0。 |
whiteSpace | 定义空白字符(换行、回车、空格以及制表符)的处理方式。 |
复合元素包含了其他的元素及/或属性。
复合元素指包含其他元素及/或属性的 XML 元素。
注意: 上述元素均可包含属性!
复合元素,"product",是空的:
复合元素,"employee",仅包含其他元素:
复合 XML 元素,"food",仅包含文本:
复合XML元素,"description"包含元素和文本:
请看这个复合 XML 元素,"employee",仅包含其他元素:
在 XML Schema 中,我们有两种方式来定义复合元素:
1. 通过命名此元素,可直接对"employee"元素进行声明,就像这样:
假如您使用上面所描述的方法,那么仅有 "employee" 可使用所规定的复合类型。请注意其子元素,"firstname" 以及 "lastname",被包围在指示器 <sequence>中。这意味着子元素必须以它们被声明的次序出现。您会在 XSD 指示器 这一节学习更多有关指示器的知识。
2. "employee" 元素可以使用 type 属性,这个属性的作用是引用要使用的复合类型的名称:
如果您使用了上面所描述的方法,那么若干元素均可以使用相同的复合类型,比如这样:
您也可以在已有的复合元素之上以某个复合元素为基础,然后添加一些元素,就像这样:
上述就是有关于 XML Schema 复合元素的内容,在下一节内容中,我们将了解复合空元素。
空的复合元素不能包含内容,只能含有属性。
一个空的 XML 元素:
上面的 "product" 元素根本没有内容。为了定义无内容的类型,我们就必须声明一个在其内容中只能包含元素的类型,但是实际上我们并不会声明任何元素,比如这样:
在上面的例子中,我们定义了一个带有复合内容的复合类型。complexContent 元素给出的信号是,我们打算限定或者拓展某个复合类型的内容模型,而 integer 限定则声明了一个属性但不会引入任何的元素内容。
但是,也可以更加紧凑地声明此 "product" 元素:
或者您可以为一个 complexType 元素起一个名字,然后为 "product" 元素设置一个 type 属性并引用这个 complexType 名称(通过使用此方法,若干个元素均可引用相同的复合类型):
"仅含元素"的复合类型元素是只能包含其他元素的元素。
XML 元素,"person",仅包含其他的元素:
您可在 schema 中这样定义 "person" 元素:
请留意这个 。它意味着被定义的元素必须按上面的次序出现在 "person" 元素中。
或者您可以为 complexType 元素设定一个名称,并让 "person" 元素的 type 属性来引用此名称(如使用此方法,若干元素均可引用相同的复合类型):
在下一节内容中,你将了解仅包含文本的 XML Schema 复合类型。
仅含文本的复合元素可包含文本和属性。
此类型仅包含简易的内容(文本和属性),因此我们要向此内容添加 simpleContent 元素。当使用简易内容时,我们就必须在 simpleContent 元素内定义扩展或限定,就像这样:
提示: 请使用 extension 或 restriction 元素来扩展或限制元素的基本简易类型。 这里有一个 XML 元素的例子,"shoesize",其中仅包含文本:
下面这个例子声明了一个复合类型,其内容被定义为整数值,并且 "shoesize" 元素含有名为 "country" 的属性:
我们也可为 complexType 元素设定一个名称,并让 "shoesize" 元素的 type 属性来引用此名称(通过使用此方法,若干元素均可引用相同的复合类型):
XML Schema 复合元素类型还可以同时包含属性、元素以及文本,即,混合内容型的复合元素,你可以参考下一节的内容以获得详细信息。
混合的复合类型可包含属性、元素以及文本。
XML 元素,"letter",含有文本以及其他元素:
下面这个 schema 声明了这个 "letter" 元素:
注意: 为了使字符数据可以出现在 "letter" 的子元素之间,mixed 属性必须被设置为 "true"。<xs:sequence> 标签 (name、orderid 以及 shipdate ) 意味着被定义的元素必须依次出现在 "letter" 元素内部。
我们也可以为 complexType 元素起一个名字,并让 "letter" 元素的 type 属性引用 complexType 的这个名称(通过这个方法,若干元素均可引用同一个复合类型):
在 XML Schema 中,指示器的类型有七种,本节有相关的介绍。
通过指示器,我们可以控制在文档中使用元素的方式。
有七种指示器:
Order 指示器:
Occurrence 指示器:
Group 指示器:
Order 指示器用于定义元素的顺序。
<all> 指示器规定子元素可以按照任意顺序出现,且每个子元素必须只出现一次:
注意: 当使用 <all> 指示器时,你可以把 <minOccurs> 设置为 0 或者 1,而只能把 <maxOccurs> 指示器设置为 1(稍后将讲解 <minOccurs> 以及 <maxOccurs>)。
<choice> 指示器规定可出现某个子元素或者可出现另外一个子元素(非此即彼):
<sequence> 规定子元素必须按照特定的顺序出现:
Occurrence 指示器用于定义某个元素出现的频率。
注意: 对于所有的 "Order" 和 "Group" 指示器(any、all、choice、sequence、group name 以及 group reference),其中的 maxOccurs 以及 minOccurs 的默认值均为 1。
<maxOccurs> 指示器可规定某个元素可出现的最大次数:
上面的例子表明,子元素 "child_name" 可在 "person" 元素中最少出现一次(其中 minOccurs 的默认值是 1),最多出现 10 次。
<minOccurs> 指示器可规定某个元素能够出现的最小次数:
上面的例子表明,子元素 "child_name" 可在 "person" 元素中出现最少 0 次,最多出现 10 次。
提示:如需使某个元素的出现次数不受限制,请使用 maxOccurs="unbounded" 这个声明:
名为 "Myfamily.xml" 的 XML 文件:
上面这个 XML 文件含有一个名为 "persons" 的根元素。在这个根元素内部,我们定义了三个 "person" 元素。每个 "person" 元素必须含有一个 "full_name" 元素,同时它可以包含多至 5 个 "child_name" 元素。
这是schema文件"family.xsd":
Group 指示器用于定义相关的数批元素。
元素组通过 group 声明进行定义:
您必须在 group 声明内部定义一个 all、choice 或者 sequence 元素。下面这个例子定义了名为 "persongroup" 的 group,它定义了必须按照精确的顺序出现的一组元素:
在您把 group 定义完毕以后,就可以在另一个定义中引用它了:
属性组通过 attributeGroup 声明来进行定义:
下面这个例子定义了名为 "personattrgroup" 的一个属性组:
在您已定义完毕属性组之后,就可以在另一个定义中引用它了,就像这样:
本节为你介绍 XML Schema any 元素的使用,可以用来扩展 XML 文档。
<any> 元素使我们有能力通过未被 schema 规定的元素来拓展 XML 文档!
<any> 元素
<any> 元素使我们有能力通过未被 schema 规定的元素来拓展 XML 文档!
下面这个例子是从名为 "family.xsd" 的 XML schema 中引用的片段。它展示了一个针对 "person" 元素的声明。通过使用 <any> 元素,我们可以通过任何元素(在 <lastname> 之后)扩展 "person" 的内容:
提示:在一个复杂类型中加入 <xs:any minOccurs="0"/>,则可通过其他外部元素扩展原复杂类型。
现在,我们希望使用 "children" 元素来扩展 "person" 元素。这此种情况下我们就可以这么做,即使以上这个 schema 的作者没有声明任何 "children" 元素。
请看这个 schema 文件,名为 "children.xsd":
下面这个 XML 文件(名为 "Myfamily.xml"),使用了来自两个不同的 schema 中的成分,"family.xsd" 和 "children.xsd":
上面这个 XML 文件是有效的,这是由于 schema "family.xsd" 允许我们通过在 "lastname" 元素后的可选元素来扩展 "person" 元素。
<any> 和 <anyAttribute> 均可用于制作可扩展的文档!它们使文档有能力包含未在主 XML schema 中声明过的附加元素。
在下一节内容中我们将讲解 anyAttribute 元素。
你还可以使用 <anyAttribute> 元素制作可扩展的 XML 文档,它与 <any> 的扩展功能类似,只是针对属性进行扩展。
<anyAttribute> 元素使我们有能力通过未被 schema 规定的属性来扩展 XML 文档!
<anyAttribute> 元素使我们有能力通过未被 schema 规定的属性来扩展 XML 文档!
下面的例子是来自名为 "family.xsd" 的 XML schema 的一个片段。它为我们展示了针对 "person" 元素的一个声明。通过使用 <anyAttribute> 元素,我们就可以向 "person" 元素添加任意数量的属性:
现在,我们希望通过 "gender" 属性来扩展 "person" 元素。在这种情况下我们就可以这样做,即使这个 schema 的作者从未声明过任何 "gender" 属性。
请看这个 schema 文件,名为 "attribute.xsd":
下面这个 XML(名为 "Myfamily.xml"),使用了来自不同 schema 的成分,"family.xsd" 和 "attribute.xsd":
上面这个 XML 文件是有效的,这是因为 schema "family.xsd" 允许我们向 "person" 元素添加属性。
<any> 和 <anyAttribute> 均可用于制作可扩展的文档!它们使文档有能力包含未在主 XML schema 中声明过的附加元素。
通过 XML Schema,一个元素可对另一个元素进行替换。
让我们举例说明:我们的用户来自英国和挪威。我们希望有能力让用户选择在 XML 文档中使用挪威语的元素名称还是英语的元素名称。
为了解决这个问题,我们可以在 XML schema 中定义一个 substitutionGroup。首先,我们声明主元素,然后我们会声明次元素,这些次元素可声明它们能够替换主元素。
在上面的例子中,"name" 元素是主元素,而 "navn" 元素可替代 "name" 元素。
请看一个 XML schema 的片段:
有效的 XML 文档类似这样(根据上面的 schema):
或类似这样:
XML Schema 元素替换注意事项:
1、替换元素和被替换元素都必须使用全局元素来声明;
2、替换元素与被替换元素要么有相同的数据类型,要么替换元素类型是被替换元素类型的派生类型。
为防止其他的元素替换某个指定的元素,请使用 block 属性:
请看某个 XML schema 的片段:
合法的 XML 文档应该类似这样(根据上面的 schema):
但是下面的文档不再合法:
可替换元素的类型必须和主元素相同,或者从主元素衍生而来。假如可替换元素的类型与主元素的类型相同,那么您就不必规定可替换元素的类型了。
请注意,substitutionGroup 中的所有元素(主元素和可替换元素)必须被声明为全局元素,否则就无法工作!
全局元素指 "schema" 元素的直接子元素!本地元素(Local elements)指嵌套在其他元素中的元素。
本节会为您演示如何编写一个 XML Schema。您还将学习到编写 schema 的不同方法。
让我们看看这个名为 "shiporder.xml" 的 XML 文档:
上面的XML文档包括根元素 "shiporder",其中包含必须名为 "orderid" 的属性。"shiporder" 元素包含三个不同的子元素:"orderperson"、"shipto" 以及 "item"。"item" 元素出现了两次,它含有一个 "title"、一个可选 "note" 元素、一个 "quantity" 以及一个 "price" 元素。
上面这一行 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance",告知XML解析器根据某个 schema 来验证此文档。这一行:xsi:noNamespaceSchemaLocation="shiporder.xsd" 规定了 schema 的位置(在这里,它与 "shiporder.xml" 处于相同的文件夹)。
现在,我们需要为上面这个 XML 文档创建一个 schema。
我们可以通过打开一个新的文件来开始,并把这个文件命名为 "shiporder.xsd"。要创建schema,我们仅仅需要简单地遵循 XML 文档中的结构,定义我们所发现的每个元素。首先我们开始定义一个标准的 XML 声明:
在上面的 schema 中,我们使用了标准的命名空间 (xs),与此命名空间相关联的 URI 是 Schema 的语言定义(Schema language definition),其标准值是 http://www.w3.org/2001/XMLSchema。
接下来,我们需要定义 "shiporder" 元素。此元素拥有一个属性,其中包含其他的元素,因此我们将它认定为复合类型。"shiporder" 元素的子元素被 xs:sequence 元素包围,定义了子元素的次序:
然后我们需要把 "orderperson" 元素定义为简易类型(这是因为它不包含任何属性或者其他的元素)。类型 (xs:string) 的前缀是由命名空间的前缀规定的,此命名空间与指示预定义的 schema 数据类型的 XML schema 相关联:
接下来,我需要把两个元素定义为复合类型:"shipto" 和 "item"。我们从定义 "shipto" 元素开始:
通过 schema,我们可使用 maxOccurs 和 minOccurs 属性来定义某个元素可能出现的次数。maxOccurs 定义某元素出现次数的最大值,而 minOccurs 则定义某元素出现次数的最小值。maxOccurs 和 minOccurs 的默认值都是 1!
现在,我们可以定义 "item" 元素了。这个元素可在 "shiporder" 元素内部出现多次。这是通过把 "item" 元素的 maxOccurs 属性的值设定为 "unbounded" 来实现的,这样 "item" 元素就可出现创作者所希望的任意多次。请注意,"note" 元素是可选元素。我们已经把此元素的 minOccurs 属性设定为 0 了:
现在,我们可以声明 "shiporder" 元素的属性了。由于这是一个必选属性,我们规定 use="required"。
注意:此属性的声明必须被置于最后:
这是这个名为 "shiporder.xsd" 的 schema 文件的文档清单:
前面的设计方法非常容易,但当文档很复杂时却难以阅读和维护。
接下来介绍的设计方法基于首先对所有元素和属性的定义,然后再使用 ref 属性来引用它们。
这是用新方法设计的 schema 文件("shiporder.xsd"):
第三种设计方法定义了类或者类型,这样使我们有能力重复使用元素的定义。具体的方式是:首先对简易元素和复合元素进行命名,然后通过元素的 type 属性来指向它们
这是利用第三种方法设计的 schema 文件 ("shiporder.xsd"):
restriction 元素显示出数据类型源自于 W3C XML Schema 命名空间的数据类型。因此,下面的片段也就意味着元素或属性的值必须是字符串类型的值:
restriction 元素常被用于向元素施加限制。请看下面这些来自以上 schema 的片段:
这段代码指示出,元素或属性的值必须为字符串,并且必须是连续的六个字符,同时这些字符必须是 0-9 的数字。
本节为你介绍 XML Schema 的字符串数据类型。
字符串数据类型用于可包含字符串的值。
字符串数据类型可包含字符、换行、回车以及制表符。
下面是一个关于某个 scheme 中字符串声明的例子:
文档中的元素看上去应该类似这样:
或者类似这样:
注意:如果您使用字符串数据类型,XML 处理器就不会更改其中的值。
规格化字符串数据类型源自于字符串数据类型。
规格化字符串数据类型同样可包含字符,但是 XML 处理器会移除折行,回车以及制表符。
下面是一个关于在某个 schema 中规格化字符串数据类型的例子:
文档中的元素看上去应该类似这样:
或者类似这样:
注意:在上面的例子中,XML 处理器会使用空格替换所有的制表符。
Token 数据类型同样源自于字符串数据类型。
Token 数据类型同样可包含字符,但是 XML 处理器会移除换行符、回车、制表符、开头和结尾的空格以及(连续的)空格。
下面是在 schema 中一个有关 token 声明的例子:
文档中的元素看上去应该类似这样:
或者类似这样:
注意:>在上面这个例子中,XML 解析器会移除制表符。
请注意,所有以下的数据类型均衍生于字符串数据类型(除了字符串数据类型本身)!
名称 | 描述 |
---|---|
ENTITIES | |
ENTITY | |
ID | 在 XML 中提交 ID 属性的字符串 (仅与 schema 属性一同使用) |
IDREF | 在 XML 中提交 IDREF 属性的字符串(仅与 schema 属性一同使用) |
IDREFS language | 包含合法的语言 id 的字符串 |
Name | 包含合法 XML 名称的字符串 |
NCName | |
NMTOKEN | 在 XML 中提交 NMTOKEN 属性的字符串 (仅与 schema 属性一同使用) |
NMTOKENS | |
normalizedString | 不包含换行符、回车或制表符的字符串 |
QName | |
string | 字符串 |
token | 不包含换行符、回车或制表符、开头或结尾空格或者多个连续空格的字符串 |
可与字符串数据类型一同使用的限定:
以上就是 XML Schema 中字符串数据类型的讲解内容。
XSD 日期和时间数据类型定义了文档中的日期与时间。
日期及时间数据类型用于包含日期和时间的值。
日期数据类型用于定义日期。
日期使用此格式进行定义:"YYYY-MM-DD",其中:
注意:所有的成分都是必需的
下面是一个有关 schema 中日期声明的例子:
文档中的元素看上去应该类似这样:
如需规定一个时区,您也可以通过在日期后加一个 "Z" 的方式,使用世界调整时间(UTC time)来输入一个日期 - 比如这样:
或者也可以通过在日期后添加一个正的或负时间的方法,来规定以世界调整时间为准的偏移量 - 比如这样:
提示:利用 xs:date() 来强制转换某个字符串为日期类型时,字符串参数的格式需要严格按照遵循:yyyy-mm-dd。
h2>时间数据类型(Time Data Type)
时间数据类型用于定义时间。
时间使用下面的格式来定义:"hh:mm:ss",其中
注意: 所有的成分都是必需的!
下面是一个有关 schema 中时间声明的例子:
文档中的元素看上去应该类似这样:
或者类似这样:
如需规定一个时区,您也可以通过在时间后加一个 "Z" 的方式,使用世界调整时间(UTC time)来输入一个时间 - 比如这样:
或者也可以通过在时间后添加一个正的或负时间的方法,来规定以世界调整时间为准的偏移量 - 比如这样:
日期时间数据类型用于定义日期和时间。
日期时间使用下面的格式进行定义:"YYYY-MM-DDThh:mm:ss",其中:
注意: 所有的成分都是必需的!
下面是一个有关 schema 中日期时间声明的例子:
文档中的元素看上去应该类似这样:
或者类似这样:
如需规定一个时区,您也可以通过在日期时间后加一个 "Z" 的方式,使用世界调整时间(UTC time)来输入一个日期时间 - 比如这样:
或者也可以通过在时间后添加一个正的或负时间的方法,来规定以世界调整时间为准的偏移量 - 比如这样:
h2>持续时间数据类型(Duration Data Type)
持续时间数据类型用于规定时间间隔。
时间间隔使用下面的格式来规定:"PnYnMnDTnHnMnS",其中:
下面是一个有关 schema 中持续时间声明的例子:
文档中的元素看上去应该类似这样:
上面的例子表示一个 5 年的周期。
或者类似这样:
上面的例子表示一个 5 年、2 个月及 10 天的周期。
或者类似这样:
上面的例子表示一个 5 年、2 个月、10 天及 15 小时的周期。
或者类似这样:
上面的例子表示一个 15 小时的周期。
如需规定一个负的持续时间,请在 P 之前输入减号:
上面的例子表示一个负 10 天的周期。
名称 | 描述 |
---|---|
date | 定义一个日期值 |
dateTime | 定义一个日期和时间值 |
duration | 定义一个时间间隔 |
gDay | 定义日期的一个部分 - 天 (DD) |
gMonth | 定义日期的一个部分 - 月 (MM) |
gMonthDay | 定义日期的一个部分 - 月和天 (MM-DD) |
gYear | 定义日期的一个部分 - 年 (YYYY) |
gYearMonth | 定义日期的一个部分 - 年和月 (YYYY-MM) |
time | 定义一个时间值 |
可与日期数据类型一同使用的限定:
以上就是关于 XML Schema 日期/时间 数据类型的相关内容。
本节为你讲解 XML Schema 中的数值数据类型。
十进制数据类型用于规定一个数值。
下面是一个关于某个 scheme 中十进制数声明的例子。
文档中的元素看上去应该类似这样:
或者类似这样:
或者类似这样:
或者类似这样:
或者类似这样:
注意: 您可规定的十进制数字的最大位数是 18 位。
整数数据类型用于规定无小数成分的数值。
下面是一个关于某个 scheme 中整数声明的例子。
文档中的元素看上去应该类似这样:
或者类似这样:
或者类似这样:
或者类似这样:
请注意,下面所有的数据类型均源自于十进制数据类型(除 decimal 本身以外)!
名字 | 秒数 |
---|---|
byte | 有正负的 8 位整数 |
decimal | 十进制数 |
int | 有正负的 32 位整数 |
integer | 整数值 |
long | 有正负的 64 位整数 |
negativeInteger | 仅包含负值的整数 ( .., -2, -1.) |
nonNegativeInteger | 仅包含非负值的整数 (0, 1, 2, ..) |
nonPositiveInteger | 仅包含非正值的整数 (.., -2, -1, 0) |
positiveInteger | 仅包含正值的整数 (1, 2, ..) |
short | 有正负的 16 位整数 |
unsignedLong | 无正负的 64 位整数 |
unsignedInt | 无正负的 32 位整数 |
unsignedShort | 无正负的 16 位整数 |
unsignedByte | 无正负的 8 位整数 |
可与数值数据类型一同使用的限定:
本节介绍 XML Schema 中的一些其他的数据类型。
其他杂项数据类型包括布尔、base64Binary、十六进制、浮点、双精度、anyURI、anyURI 以及 NOTATION。
布尔数据性用于规定 true 或 false 值。
下面是一个关于某个 scheme 中逻辑声明的例子:
文档中的元素看上去应该类似这样:
注意: 合法的布尔值是 true、false、1(表示 true) 以及 0(表示 false)。
二进制数据类型用于表达二进制形式的数据。
我们可使用两种二进制数据类型:
下面是一个关于某个 scheme 中 hexBinary 声明的例子:
anyURI 数据类型用于规定 URI。
下面是一个关于某个 scheme 中 anyURI 声明的例子:
文档中的元素看上去应该类似这样:
注意: 如果某个 URI 含有空格,请用 %20 替换它们。
名称 | 描述 |
---|---|
anyURI | |
base64Binary | |
boolean | |
double | |
float | |
hexBinary | |
NOTATION | |
QName |
可与杂项数据类型一同使用的限定:
*译者注:约束指 constraint。
使用专业的XML编辑器你可以更好的编写XML文档。
XML 指可扩展标记语言
你可以使用简单的XML编辑器如记事本来创建或者编辑XML文件。
然而,当你开始使用XML,你很快就会发现它使用专业的XML编辑器可以更好的 编辑XML文件。
许多开发人员使用记事本来编辑 XML 和 HTML 文档,这是因为最常用的操作系统都带有记事本,而且它很容易使用。从个人来讲,我经常使用记事本来快速地编辑某些简单的 HTML、CSS 以及 XML 文件。
但是,如果您使用记事本对 XML 进行编辑,可能很快会发现不少问题。
不能确定您编辑的文档类型,所以也就无法辅助您的工作。
当今,XML 是非常重要的技术,并且开发项目正在使用这些基于 XML 的技术:
为了能够编写出无错的 XML 文档,您需要一款智能的 XML 编辑器!
专业的 XML 编辑器会帮助您编写无错的 XML 文档,根据某种 DTD 或者 schema 来验证 XML,以及强制您创建合法的 XML 结构。
XML 编辑器应该具有如下能力:
本教程已经向您讲解了如何描述 XML 文档的结构。
您已经学习了如何使用 XML Schema 来定义 XML 文档的合法元素,就像 DTD。我们认为,XML Schema 作为 DTD 的替代者,会很快被应用于大多数 Web 应用程序中。
您还学习到,XML Schema 是很完善的。与 DTD 不同,XML Schema 支持数据类型(data type)和命名空间(namespace)。
请参阅我们的 XML Schema 参考手册,获得更多有关 XML Schema 的信息。
下一步应该学习 WSDL。
WSDL 是一种基于 schema 的语言,用来描述 Web service 以及如何如何访问它们。
WSDL 可描述 Web service,连同用于 Web service 的消息格式和协议细节。
如果您希望学习更多有关 WSDL 的知识,请访问我们的 WSDL 教程。
元素 | 解释 |
---|---|
all | 规定子元素能够以任意顺序出现,每个子元素可出现零次或一次。 |
annotation | annotation 元素是一个顶层元素,规定 schema 的注释。 |
any | 使创作者可以通过未被 schema 规定的元素来扩展 XML 文档。 |
anyAttribute | 使创作者可以通过未被 schema 规定的属性来扩展 XML 文档。 |
appInfo | 规定 annotation 元素中应用程序要使用的信息。 |
attribute | 定义一个属性。 |
attributeGroup | 定义在复杂类型定义中使用的属性组。 |
choice | 仅允许在 <choice> 声明中包含一个元素出现在包含元素中。 |
complexContent | 定义对复杂类型(包含混合内容或仅包含元素)的扩展或限制。 |
complexType | 定义复杂类型。 |
documentation | 定义 schema 中的文本注释。 |
element | 定义元素。 |
extension | 扩展已有的 simpleType 或 complexType 元素。 |
field | 规定 XPath 表达式,该表达式规定用于定义标识约束的值。 |
group | 定义在复杂类型定义中使用的元素组。 |
import | 向一个文档添加带有不同目标命名空间的多个 schema。 |
include | 向一个文档添加带有相同目标命名空间的多个 schema。 |
key | 指定属性或元素值(或一组值)必须是指定范围内的键。 |
keyref | 规定属性或元素值(或一组值)对应指定的 key 或 unique 元素的值。 |
list | 把简单类型定义为指定数据类型的值的一个列表。 |
notation | 描述 XML 文档中非 XML 数据的格式。 |
redefine | 重新定义从外部架构文件中获取的简单和复杂类型、组和属性组。 |
restriction | 定义对 simpleType、simpleContent 或 complexContent 的约束。 |
schema | 定义 schema 的根元素。 |
selector | 指定 XPath 表达式,该表达式为标识约束选择一组元素。 |
sequence | 要求子元素必须按顺序出现。每个子元素可出现 0 到任意次数。 |
simpleContent | 包含对 complexType 元素的扩展或限制且不包含任何元素。 |
simpleType | 定义一个简单类型,规定约束以及关于属性或仅含文本的元素的值的信息。 |
union | 定义多个 simpleType 定义的集合。 |
unique | 指定属性或元素值(或者属性或元素值的组合)在指定范围内必须是唯一的。 |
限定 | 描述 |
---|---|
enumeration | 定义可接受值的一个列表 |
fractionDigits | 定义所允许的最大的小数位数。必须大于等于0。 |
length | 定义所允许的字符或者列表项目的精确数目。必须大于或等于0。 |
maxExclusive | 定义数值的上限。所允许的值必须小于此值。 |
maxInclusive | 定义数值的上限。所允许的值必须小于或等于此值。 |
maxLength | 定义所允许的字符或者列表项目的最大数目。必须大于或等于0。 |
minExclusive | 定义数值的下限。所允许的值必需大于此值。 |
minInclusive | 定义数值的下限。所允许的值必需大于或等于此值。 |
minLength | 定义所允许的字符或者列表项目的最小数目。必须大于或等于0。 |
pattern | 定义可接受的字符的精确序列。 |
totalDigits | 定义所允许的阿拉伯数字的精确位数。必须大于0。 |
whiteSpace | 定义空白字符(换行、回车、空格以及制表符)的处理方式。 |