登陆注册
14253100000022

第22章 内容的表达和元数据(6)

4.5.1.1键—长度—值结构

KLV协议用16个字节的全局标签(Universal Label, UL)作为标识键,其后跟随给出数据值长度的数字值。键是一个全局标签,根据SMPTE 298M,开头以一个对象标识开始,紧跟着一个全局标签大小。全局标签标识以一个标识组织用的标准的编码开始,其后是SMPTE的次级标识符。接下来的字节标识符是注册的类别,如SMPTE元数据字典,6和7字节更具体地标识带有版本编号的注册和结构。在全局标签标识中,对特别条目的特殊标识由9~16字节表示。

长度部分根据基本编码规则(Basic Encoding Rules, EBR)编码。可以根据ISO标准使用长度字节的长或短的编码。数据值可以是单个数据或者数据组。

4.5.1.2KLV数据编码

单个数据的编码应用键来标识参考框架和数据类型、长度以及编码值。因为对于一个描述符有很多种字典提供了表达的方法,所以要选择用哪种方法来表示,(根据所应用的表示键)要选择一个初始的定义表示方法。备选方案在最左边字节由非零值和字典中存储的值表示。

为了支持个体数据元素的逻辑组或者使一组元素可以编码在一起,定义了分组编码方案。该编码方案可以用键单元减少冗余信息。分组编码也可以用于建立数据元素的逻辑组。KLV编码协议可以用于广义集合、全局集合、局部集合、可变长度包以及定长包。编码效率从广义集合到定长包递增,即广义集合效率最低,定长包效率最高。KLV分组编码详细介绍如下:

·广义集合,用来构建一个数据元素和其他KLV编码项目的逻辑组。在广义集合中用到了全部的KLV编码。

·全局集合,和广义集合定义方式一样,但是编码效率比广义集合要高,因为它使用共享的键头,这和原始键能够完全恢复的无压缩编码效果一样。

·局部集合,和广义集合编码方式一样,但是由于使用了简短的局部标识而有了更高的编码效率。这些标识只在局部集合中有意义,它保存了KLV数据结构的构架,但是局部标识需要有独立和具体的定义标准来定义其具体意义。同时也要定义局部标识如何映射在广义的标识键值中。

·可变长度包,用来定义为一个数据元素的深度分组(并且移除了组中所有元素的UL键和局部标识)的使用。可变长度包依赖于定义包中数据元素顺序的标准或规范。

·定长包,不仅移除了UL键和局部标识的使用,同时也去除了组中所有单个元素的长度。因此,定长包基于定义了包中数据元素的命令和每个数据元素长度的标准。这样使得定长包成为编码最有效率但也是最不灵活的数据元素编组。

集合和包是由很多KLV集合和大包数据的结构编码归组的单个数据元素组成。它们由SMPTE注册机关给予注册的广义标识键所定义。由集合编码的数据元素可能不仅仅是一个数据字典的项目,同时可能是其他包和集合的元素;而包只能编码一个数据字典中的一组单个项目,如它们不能使用循环递归编码。键的第5个字节定义了集合和包,第6字节定义了集合和包的类型。

标签是标识标签自己定义的有意义(或者值)的对象的特殊类型。因此,标签不需要长度域和值域,它们要在特殊的标签字典中被定义。

4.5.2可扩展标记语言

可扩展标记语言(eXtensible Markup Language, XML)是由W3C定义,由SGML(见3.5.2.1节)发展而来的非常灵活的文本格式。XML最初被大型电子出版业使用,现在已用于更广泛的数据范围(特别是网络)。它为数据内容定义了一个容器格式和自动验证结构,如XML描述了一个数据对象类(称为XML文档)并部分描述了计算机程序处理过程的行为。XML的设计目标是:

·在互联网上直接使用。

·支持广泛的应用。

·可以与SGML相媲美。

·优化处理XML文档的程序开发。

·最小化的可操作特征。

·XML编码文档易懂,可以方便、快速地建立。

·XML文档易被建立。

XML定义了文档建立的方式、描述了文档的结构、指定了其要包含的实体。XML文档的关键元素是标记,它以标签的方式存在,最常用的是封装文本元素的开始标签和结束标签。标签被用于结构化文档和部分文档。标签还组成实体和参数属性、描述、文档类型和XML声明,以及处理指令和内部别名。

根据标签的定义和文档类型的声明,并没有规定具体的结构,如并没有定义XML文档的具体形式、所包含元素的数量、元素的格式,以及判断一个好的XML文档的具体标准。XML1.0定义了一个文档需要包含一个或者多个元素,每个元素都由开始标签和结束标签限定。因此,它提供了一个语义框架以形成完整的能够供检索系统使用的XML文档。除了简单元素之外,XML文档还包含属性,即文档中可以赋值的实体。

如果XML文档中没有任何元素的深层定义和量化、没有元素的特征和关系、没有元素在文档中出现的次数统计以及没有给定文档结构中的指定位置,XML文档就不能被编译。因为没有参考点,所以就不能决定文档是否是完好的和有效的。另外,为了交换XML文档中的信息,有必要使所有参与的部分有着和文档内容一样的结构意义和编译方法。可以应用一个XML方案来指定XML文档元素的特征和关系以及XML文档类的属性。信息和文档的分类以及交换由具体的XML方案或者文档类型优化。这基本为特殊文档类型定义了一个框架。有很多XML方案可以用于定义XML文档类型和指定分类。最常用的是文档类型定义(Document Type Definitions, DTD)和W3C XML方案。

内容管理中重要的是不仅可以将XML应用于文档,还可以将其应用于数据流。因此,除了适合基本的文件转换以外,XML还特别适用于内容传输。

4.5.2.1文档类型定义

能够指定XML文档结构的一种形式是使用DTD。DTD是用非XML语法写成的,它描述了特定文档类型的文档结构和允许的内容。DTD基于SGML使用扩展的Bakus-Naur形式(Extended Bakus-Naur Form, EBNF)。DTD声明了XML的文档类型、元素和属性。因为它主要是定义文档的(即它的中心是文档定义而不是数据定义),所以不太支持多种数据类型。DTD只声明元素的特征数据而不指定该数据类型。因此,它不能指定数据类型的所属范围和具体元素的属性,它只给出某一个类型的文档所应该包含的结构和元素。

4.5.2.2W3C XML方案

W3C最初指定了用XML语义的XML方案,它不仅定义了XML文档和文档类型的结构,还综合了XML命名空间、结构方案、数据类型以及继承用法。W3C XML方案定义(XML Scheme Definition, XSD)的三种主要方案——XML方案第0部分:入门;XML方案第1部分:结构;XML方案第2部分:数据类型。第1部分定义了XML方案的定义语言,它用来描述XSD所定义的XML文档的结构和内容组成。第2部分描述了一些植入的、基本的数据类型(如整数、日期和二进制数据),并定义了附加数据类型用XML方案的定义语言定义的方法。XSD提供和DTD相似的元素类型声明和属性声明的机制,另外它还支持对于最大和最小出现频率的定义。

XSD和DTD最大的不同是XSD定义了数据类型列表。XSD区别了简单数据类型和推导出的数据类型。推导出的数据类型定义了由规则和列表推导出的进一步的数据类型。

除了简单数据类型,第2部分还定义了很多的推导数据类型(如规则字符串、名称、ID、长短字节等)。XSD定义的命名空间要加xsd命名空间前缀。

同类推荐
  • 生物多样性的法律保护

    生物多样性的法律保护

    本书内容包括:生物多样性概述、生态系统的多样性、外来物种入侵、遗传资源多样性、生物技术与生物安全问题、生物多样性保护国际公约的履行与国内立法等。
  • 班主任应对班级偶发事件的技巧

    班主任应对班级偶发事件的技巧

    《班主任应对班级偶发事件的技巧》这本书。书中列举的大量真实生动的案例,无不充满智慧,充满心与心的交流。书中的一幕幕校园闹剧,让我有种似曾相识的感觉;书中老师的“斗智斗勇”,让我感到耳目一新,由衷叹服。不.禁感慨教育真是一门充满智慧的学问!
  • 国际危机传播

    国际危机传播

    由高晓虹和隋岩主编的《国际危机传播》结合丰富的案例,在厘清危机传播与国际危机传播的关系、剖析危机传播国际化趋势的基础上,对国际危机传播中媒介组织的社会功能、生产机制、报道策略,以及公共政策、文化在国际危机传播中的作用,进行了深入的探讨;创新性地引入修辞学和阐释学理论,对国际危机传播中的文本修辞和过度报道进行了详尽分析。国际危机此起彼伏,国际危机传播影响深远,如何临希不乱,有效地进行媒体传播,帮助各方面转“危”为“机”,是《国际危机传播》的宗旨所在。
  • 季羡林谈翻译(典藏本)

    季羡林谈翻译(典藏本)

    季羡林先生不仅是我国的著名学者,而且是大翻译家。他精通多种外语,译著丰富,在长期的翻译工作中,积累了丰富的经验,提出了很多独到而精辟的翻译理论和观点。《季羡林谈翻译(典藏本)》精选了季羡林先生谈翻译的文章,生动有趣,活泼精炼,蕴含着深刻的道理,对学习外文和从事翻译工作的读者有所帮助。
  • 在清华谈炒作之道:卖点炮制实战

    在清华谈炒作之道:卖点炮制实战

    本书摈弃卖点炒作庸俗化的负面理解、从卖点炒作的方法、原则、理念、层层分解、剖析、对卖点炒作具有可借鉴性和可操作性。
热门推荐
  • 地狱使者

    地狱使者

    这是一封来自地狱的信,凡事看到这信的人都坚信不疑,没有人愿意,也没有人敢去加以怀疑。惨白的信纸上,用鲜红的血醒目的写着:我,来自地狱的使者,罪孽深重的人,用你们的血肉为自己赎罪吧!这是死者的血,鲜红刺目的鲜血泛着阵阵令人作呕的血腥味,张牙舞爪的字,每个线条都仿佛是用锯子锯开般,尖锐的边毛让人毛骨悚然。没有人怀疑这是一个恶作剧,因为眼前的尸体清楚的向人们展示着,地狱使者就在他们身边。人,像是脆弱的玩偶,一个接着一个死去,地狱的使者还在拖拽着人的灵魂。一时间,所有的人都陷入了深深的恐惧中,各自忏悔自己的罪孽,生怕那可怕的地狱使者突然出现,将自己拽如地狱的深渊。
  • 玩家混小子

    玩家混小子

    身怀江湖异术,搅得古玩界腥风血雨。一双通灵眼将为您揭开古玩界中那层神秘的面纱,讲述一段鲜为人知的故事。挡我财路者,削、削、削。阻我泡妞者,削、削、削。混的是江湖,玩的是心跳,泡的是美女。
  • 僧伽罗刹所集佛行经

    僧伽罗刹所集佛行经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 佛战

    佛战

    一场意外,她重回天界,原来“她”竟然是“他”,原本逍遥的三人早已各自分离,当他再次重生,这一场迟来的千年浩战,那个被关押在弱水的妖娆,那个被封印的逍遥王,一切的阴谋和秘密,他将会一一找出答案!
  • 课堂提问的艺术

    课堂提问的艺术

    本书内容包括:讲课离不开提问、课堂提问的概述、课堂提问的目的、课堂提问的类型、课堂提问的功能、课堂提问要有主体地位、课堂提问要讲究时机、鼓励学生发言等。
  • 佛家的智慧管理:管理也要参点禅

    佛家的智慧管理:管理也要参点禅

    禅宗是我国古代文化的一朵奇葩。我们参考禅宗修行的方法,与企业管理结合起来,借鉴前人的经验、教训、转化为自己的智慧。然后再用于管理实践。盛大网络的老总说过这么一句话:他之后以能有今天这么成功,在他看来主要是他对事业有着执著的追求。
  • 复仇道路上的恶魔公主

    复仇道路上的恶魔公主

    七岁那年,羽和茜被乔谦抛弃,后被漠凌铭浩收养并送去训练,十年的时间,她们完成训练,读完哈弗等大学的博士,把公司建立于中国,把帮派建立与法国并认识了冷瑄瑞昱还成了好姐妹。十年后,她们回来复仇了,却在学校里遇到了他们和自己的仇人。她们是选择爱情还是选择复仇,还是两全其美.......
  • 新的一天

    新的一天

    本书汇集了许立志2010年以来所写的近200首诗,其中大部分诗作是在富士康打工期间内完成的。在艰辛的打工生活中,在劳碌的流水线生产操作之余,他一直坚持颇具水准的诗歌创作。他的诗朴素、斩截而又强烈,兼具抒情性与批判性,常以荒诞的或令人震惊的笔触书写悲辛的底层生活与幽深的死亡诗意,以此来为两亿多命运的同路人立言,为底层的生存作证。
  • 三千落叶

    三千落叶

    刺客和杀手不同,杀手是为钱而刺,刺客是为道而刺。且看主角如何在这个风起云涌的异世界追逐自己的刺客之道。
  • 精灵女王的亲王殿下

    精灵女王的亲王殿下

    精灵女王要我娶她!曾经有着光辉历史的精灵如今只能苟延残喘的生存在人类与魔族、兽人的夹缝之中。为了报答精灵抚养长大的恩情,少年吉恩踏出了未知的一步,谁知,自己竟成了影响和决定精灵族未来命运的关键人物!那么,请叫我亲王殿下!