DTD全称为,Document Type Definition,中文翻译为文档类型定义,是一套为了进行程序间的数据交换而建立的关于标记符的语法规则。
文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。
DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。
假如 DTD 被包含在您的 XML 源文件中,它应当通过下面的语法包装在一个 DOCTYPE 声明中:
<!DOCTYPE root-element [element-declarations]>
带有 DTD 的 XML 文档实例(请在 IE5 以及更高的版本打开,并选择查看源代码):
<?xml version="1.0"?><!DOCTYPE note [<!ELEMENT note (to,from,heading,body)><!ELEMENT to (#PCDATA)><!ELEMENT from (#PCDATA)><!ELEMENT heading (#PCDATA)><!ELEMENT body (#PCDATA)>]><note><to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Don't forget me this weekend</body></note>
在您的浏览器中打开此 XML 文件,并选择"查看源代码"命令。
The DTD above is interpreted like this:
假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:
<!DOCTYPE root-element SYSTEM "filename">
这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD: (点击打开该文件,并选择"查看源代码"命令。)
<?xml version="1.0"?><!DOCTYPE note SYSTEM "note.dtd"><note> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body></note>
这是包含 DTD 的 "note.dtd" 文件:
<!ELEMENT note (to,from,heading,body)><!ELEMENT to (#PCDATA)><!ELEMENT from (#PCDATA)><!ELEMENT heading (#PCDATA)><!ELEMENT body (#PCDATA)>
通过 DTD,您的每一个 XML 文件均可携带一个有关其自身格式的描述。
通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。
而您的应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。
您还可以使用 DTD 来验证您自身的数据。
XML 和 HTML 文档的主要的构建模块是元素标签。在本节内容中,我们将讲解这些构建模块。
所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:
元素是 XML 以及 HTML 文档的主要构建模块。
HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。
实例:
<body>some text</body><message>some text</message>
属性可提供有关元素的额外信息。
属性总是被置于某元素的开始标签中。属性总是以名称/值的形式成对出现的。下面的 "img" 元素拥有关于源文件的额外信息:
<img src="computer.gif" />
元素的名称是 "img"。属性的名称是 "src"。属性的值是 "computer.gif"。由于元素本身为空,它被一个 " /" 关闭。
在 XML 中,一些字符是有特殊的意义的,例如,我们使用 < 表示一个标签的开始符。
实体是用来定义普通文本的变量。实体引用是对实体的引用。
大多数同学都了解这个 HTML 实体引用:" "。这个"无折行空格"实体在 HTML 中被用于在某个文档中插入一个额外的空格。
当文档被 XML 解析器解析时,实体就会被展开。
实体引用 | 字符 |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA 的意思是被解析的字符数据(parsed character data)。
可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。
PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。
文本中的标签会被当作标记来处理,而实体会被展开。
不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 实体来分别替换它们。
CDATA 的意思是字符数据(character data)。
CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
以上就是关于 DTD 构建模块的知识,如果你想要了解更多有关 HTML 标签的内容,请参考本站的《HTML参考手册》!
在一个 DTD 中,元素通过元素声明来进行声明。
在 DTD 中,XML 元素通过元素声明来进行声明。元素声明使用下面的语法:
空元素通过类别关键词EMPTY进行声明:
<!ELEMENT element-name EMPTY>实例:<!ELEMENT br EMPTY>XML example:<br />
只有 PCDATA 的元素通过圆括号中的 #PCDATA 进行声明:
<!ELEMENT element-name (#PCDATA)>实例:<!ELEMENT from (#PCDATA)>
通过类别关键词 ANY 声明的元素,可包含任何可解析数据的组合:
<!ELEMENT element-name ANY>实例:<!ELEMENT note ANY>
带有一个或多个子元素的元素通过圆括号中的子元素名进行声明:
<!ELEMENT element-name (child1)>或<!ELEMENT element-name (child1,child2,...)>实例:<!ELEMENT note (to,from,heading,body)>
当子元素按照由逗号分隔开的序列进行声明时,这些子元素必须按照相同的顺序出现在文档中。在一个完整的声明中,子元素也必须被声明,同时子元素也可拥有子元素。"note" 元素的完整声明是:
<!ELEMENT note (to,from,heading,body)><!ELEMENT to (#PCDATA)><!ELEMENT from (#PCDATA)><!ELEMENT heading (#PCDATA)><!ELEMENT body (#PCDATA)>
<!ELEMENT element-name (child-name)>实例:<!ELEMENT note (message)>
上面的例子声明了:message 子元素必须出现一次,并且必须只在 "note" 元素中出现一次。
<!ELEMENT element-name (child-name+)>实例:<!ELEMENT note (message+)>
上面的例子中的加号(+)声明了:message 子元素必须在 "note" 元素内出现至少一次。
<!ELEMENT element-name (child-name*)>实例:<!ELEMENT note (message*)>
上面的例子中的星号(*)声明了:子元素 message 可在 "note" 元素内出现零次或多次。
<!ELEMENT element-name (child-name?)>实例:<!ELEMENT note (message?)>
上面的例子中的问号(?)声明了:子元素 message 可在 "note" 元素内出现零次或一次。
实例:<!ELEMENT note (to,from,header,(message|body))>
上面的例子声明了:"note" 元素必须包含 "to" 元素、"from" 元素、"header" 元素,以及非 "message" 元素即 "body" 元素。
实例:<!ELEMENT note (#PCDATA|to|from|header|message)*>
上面的例子声明了:"note" 元素可包含出现零次或多次的 PCDATA、"to"、"from"、"header" 或者 "message"。
提示:以上几种类型都允许在元素的起始标记中使用属性。
注意:在DTD中有一个原则,没有明确声明就是禁止,并且同名的元素只能声明一次。
在 DTD 中,属性通过 ATTLIST 声明来进行声明。
属性声明使用下列语法:
<!ATTLIST element-name attribute-name attribute-type attribute-value>DTD 实例:<!ATTLIST payment type CDATA "check">XML 实例:<payment type="check" />
以下是 属性类型的选项:
类型 | 描述 |
---|---|
CDATA | 值为字符数据 (character data) |
(en1|en2|..) | 此值是枚举列表中的一个值 |
ID | 值为唯一的 id |
IDREF | 值为另外一个元素的 id |
IDREFS | 值为其他 id 的列表 |
NMTOKEN | 值为合法的 XML 名称 |
NMTOKENS | 值为合法的 XML 名称的列表 |
ENTITY | 值是一个实体 |
ENTITIES | 值是一个实体列表 |
NOTATION | 此值是符号的名称 |
xml: | 值是一个预定义的 XML 值 |
默认属性值可使用下列值 :
值 | 解释 |
---|---|
值 | 属性的默认值 |
#REQUIRED | 属性值是必需的 |
#IMPLIED | 属性不是必需的 |
#FIXED value | 属性值是固定的 |
DTD: <!ELEMENT square EMPTY><!ATTLIST square width CDATA "0">合法的 XML:<square width="100" />
在上面的例子中,"square" 被定义为带有 CDATA 类型的 "width" 属性的空元素。如果宽度没有被设定,其默认值为0 。
DTD: <!ATTLIST person number CDATA #REQUIRED>合法的 XML:<person number="5677" />非法的 XML:<person />
假如您不希望强制作者包含属性,并且您没有默认值选项的话,请使用关键词 #IMPLIED。
实例
DTD:<!ATTLIST contact fax CDATA #IMPLIED>合法的 XML:<contact fax="555-667788" />合法的 XML:<contact />
假如您不希望强制作者包含属性,并且您没有默认值选项的话,请使用关键词 #IMPLIED。
DTD:<!ATTLIST sender company CDATA #FIXED "Microsoft">合法的 XML:<sender company="Microsoft" />非法的 XML:<sender company="W3Cschools" />
如果您希望属性拥有固定的值,并不允许作者改变这个值,请使用 #FIXED 关键词。如果作者使用了不同的值,XML 解析器会返回错误。
<!ATTLIST element-name attribute-name (en1|en2|..) default-value>
DTD:<!ATTLIST payment type (check|cash) "cash">XML 例子:<payment type="check" />or<payment type="cash" />
如果您希望属性值为一系列固定的合法值之一,请使用列举属性值。
以上就是关于 DTD 中属性的知识介绍,在下一节内容中,我们将对 XML 的元素和属性进行比较。
XML 元素:指的是从开始标签到结束标签的部分,元素可包含其他元素、文本或者两者的混合物,并且元素也可以拥有属性。
XML 属性:提供关于元素的额外的信息。
在XML中,并有没有规定何时使用属性,以及何时使用子元素。
数据可以存储在子元素或属性中。
让我们来看下这些实例:
<person sex="female"> <firstname>Anna</firstname> <lastname>Smith</lastname></person>
<person> <sex>female</sex> <firstname>Anna</firstname> <lastname>Smith</lastname></person>
在第一个例子中"sex"是一个属性。在后面一个例子中,"sex"是一个子元素。但是两者都提供了相同的信息。
没有特别规定何时使用属性,以及何时使用子元素。我的经验是在HTML中多使用属性,但在XML中,使用子元素,会感觉更像数据信息。
我喜欢在子元素中存储数据
下面的三个XML文档包含完全相同的信息:
本例中使用"date"属性:
<note date="12/11/2002"> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body></note>
本例中使用"date"元素:
<note> <date>12/11/2002</date> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body></note>
本例中使用了扩展的"date" 元素: (这是我最喜欢的方式):
<note> <date> <day>12</day> <month>11</month> <year>2002</year> </date> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body></note>
你应该避免使用属性?
一些属性具有以下问题:
如果您使用属性作为数据容器,最终的XML文档将难以阅读和维护。 尝试使用 元素 来描述数据。 to describe data. 只有在提供的数据是不相关信息时我们才建议使用属性。
不要这个样子结束(这不是XML应该使用的):
<note day="12" month="11" year="2002"to="Tove" from="Jani" heading="Reminder"body="Don't forget me this weekend!"></note>
规则总是有另外的
关于属性的规则我有一个例外情况。
有时我指定的 ID 应用了元素。这些 ID 应用可在HTML中的很多相同的情况下可作为 NAME 或者 ID 属性来访问 XML 元素。以下实例展示了这种方式:
<messages><note id="p501"> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body></note><note id="p502"> <to>Jani</to> <from>Tove</from> <heading>Re: Reminder</heading> <body>I will not!</body></note></messages>
以上实例的XML文件中,ID是只是一个计数器,或一个唯一的标识符,来识别不同的音符,而不是作为数据的一部分。
在这里我想说的是,元数据(关于数据的数据)应当存储为属性,而数据本身应当存储为元素。
实体是用于定义引用普通文本或特殊字符的快捷方式的变量。
实体引用是对实体的引用。
实体可在内部或外部进行声明。
<!ENTITY entity-name "entity-value">
DTD 实例:<!ENTITY writer "Donald Duck."><!ENTITY copyright "Copyright 51coolma.cn">
XML 实例:<author>&writer;©right;</author>
注意: 一个实体由三部分构成: 一个和号 (&), 一个实体名称, 以及一个分号 (;)。
提示:内部实体在 XML 文档内部定义,实体的内容在声明中给出。内部实体都是已分析的实体,它们没有单独的物理存储对象。
<!ENTITY entity-name SYSTEM "URI/URL">
DTD 实例:<!ENTITY writer SYSTEM "//www.51coolma.cn/entities.dtd"><!ENTITY copyright SYSTEM "//www.51coolma.cn/entities.dtd">XML example:<author>&writer;©right;</author>
提示:外部实体在单独的(外部)文件中定义,外部实体可以是已分析实体,也可以是未分析实体。使用 Internet Explorer 可根据某个 DTD 来验证您的 XML。
当您试图打开某个 XML 文档时,XML 解析器有可能会产生错误。通过访问 parseError 对象,就可以取回引起错误的确切代码、文本甚至所在的行。
注意: load() 方法用于文件,而 loadXML() 方法用于字符串。
通过把 XML 解析器的 validateOnParse 设置为 "false",就可以关闭验证。
为了帮助您验证 XML 文件,我们创建了此 链接,这样你就可以验证任何 XML 文件了。
您可以在我们的《XML DOM 教程》中阅读更多有关 parseError 对象的信息。
以上就是有关 DTD 验证 XML 的全部内容,通过 DTD 验证可以表明 XML 是“合法”的 XML。
由 David Moisan 创造。拷贝自: http://www.davidmoisan.org/
<!DOCTYPE TVSCHEDULE [<!ELEMENT TVSCHEDULE (CHANNEL+)><!ELEMENT CHANNEL (BANNER,DAY+)><!ELEMENT BANNER (#PCDATA)><!ELEMENT DAY (DATE,(HOLIDAY|PROGRAMSLOT+)+)><!ELEMENT HOLIDAY (#PCDATA)><!ELEMENT DATE (#PCDATA)><!ELEMENT PROGRAMSLOT (TIME,TITLE,DESCRIPTION?)><!ELEMENT TIME (#PCDATA)><!ELEMENT TITLE (#PCDATA)> <!ELEMENT DESCRIPTION (#PCDATA)><!ATTLIST TVSCHEDULE NAME CDATA #REQUIRED><!ATTLIST CHANNEL CHAN CDATA #REQUIRED><!ATTLIST PROGRAMSLOT VTR CDATA #IMPLIED><!ATTLIST TITLE RATING CDATA #IMPLIED><!ATTLIST TITLE LANGUAGE CDATA #IMPLIED>]>
<!DOCTYPE NEWSPAPER [<!ELEMENT NEWSPAPER (ARTICLE+)><!ELEMENT ARTICLE (HEADLINE,BYLINE,LEAD,BODY,NOTES)><!ELEMENT HEADLINE (#PCDATA)><!ELEMENT BYLINE (#PCDATA)><!ELEMENT LEAD (#PCDATA)><!ELEMENT BODY (#PCDATA)><!ELEMENT NOTES (#PCDATA)><!ATTLIST ARTICLE AUTHOR CDATA #REQUIRED><!ATTLIST ARTICLE EDITOR CDATA #IMPLIED><!ATTLIST ARTICLE DATE CDATA #IMPLIED><!ATTLIST ARTICLE EDITION CDATA #IMPLIED><!ENTITY NEWSPAPER "Vervet Logic Times"><!ENTITY PUBLISHER "Vervet Logic Press"><!ENTITY COPYRIGHT "Copyright 1998 Vervet Logic Press">]>
<!DOCTYPE CATALOG [<!ENTITY AUTHOR "John Doe"><!ENTITY COMPANY "JD Power Tools, Inc."><!ENTITY EMAIL "jd@jd-tools.com"><!ELEMENT CATALOG (PRODUCT+)><!ELEMENT PRODUCT(SPECIFICATIONS+,OPTIONS?,PRICE+,NOTES?)><!ATTLIST PRODUCTNAME CDATA #IMPLIEDCATEGORY (HandTool|Table|Shop-Professional) "HandTool"PARTNUM CDATA #IMPLIEDPLANT (Pittsburgh|Milwaukee|Chicago) "Chicago"INVENTORY (InStock|Backordered|Discontinued) "InStock"><!ELEMENT SPECIFICATIONS (#PCDATA)><!ATTLIST SPECIFICATIONSWEIGHT CDATA #IMPLIEDPOWER CDATA #IMPLIED><!ELEMENT OPTIONS (#PCDATA)><!ATTLIST OPTIONSFINISH (Metal|Polished|Matte) "Matte"ADAPTER (Included|Optional|NotApplicable) "Included"CASE (HardShell|Soft|NotApplicable) "HardShell"><!ELEMENT PRICE (#PCDATA)><!ATTLIST PRICEMSRP CDATA #IMPLIEDWHOLESALE CDATA #IMPLIEDSTREET CDATA #IMPLIEDSHIPPING CDATA #IMPLIED><!ELEMENT NOTES (#PCDATA)>]>
本教程已经向您讲解了如何描述 XML 文档的结构。
您学习到了如何使用 DTD 来定义一个 XML 文档的合法元素,以及如何在您的 XML 内部或者作为一个外部引用来声明 DTD。
您已经学习了如何为 XML 文档声明合法的元素、属性、实体以及 CDATA 部分。
您也看到了如何根据某个 DTD 来验证一个 XML 文档。
下一步应当学习 XML Schema。
XML Schema 用于定义 XML 文档的合法元素,类似 DTD。我们认为 XML Schema 很快会将 DTD 取而代之,被用在大部分的网络应用程序中。
XML Schema 是基于 XML 的 DTD 替代物。
与 DTD 不同,XML Schema 支持数据类型和命名空间。
如果您希望学习更多有关 XML Schema 的知识,请访问我们的《XML Schema 教程》。
以上就是 DTD 教程的全部内容了,助您学习愉快!