登陆注册
14253100000018

第18章 内容的表达和元数据(2)

4.2.1.3数据模型和元数据

数据模型在内容管理系统中非常重要,它们使得关于对象的元数据在数据库系统中得以结构化的表达。本书不涉及对于数据模型的详细讨论,然而在内容管理系统中了解其基本概念和原理是重要的。

数据模型是带有描述数据和操纵它的一组操作的集合的(数学)形式。数据模型已经发展了数年,有很多结构化表示信息的方法。有实体关系模型、网络模型、层级模型、关系模型和面向对象模型。实体关系模型利用实体关系图和概念化的方案自然地对组织进行描述。此时的实体是可标识的对象,它们之间的关系表现在同一模型中的不同实体间的关联上。网络数据模型和实体关系模型相比其所有关系仅限于二进制编码、多对一的关系。在层级模型中实体之间的关系以层级关系来组织。

关系数据模型是面向“值”的。根据关系来定义操作,其结果是产生关系。在关系模型中,操作可以很容易地组合和串联。关系模型中的数学概念是集合理论关系,是关于域列表的笛卡尔乘积的一个子集。

对象在面向对象的模型中是有特定地址的记录。对象可以编入复杂结构并且被定义类别和层级。类型可以有不同特征的子类型。和关系模型相比,面向对象的模型不易组织,这是因为面向对象的模型使用了抽象数据类型,并且不支持对其他操作结果的进一步操作。

评估了表示内容的数据模型的不同的有利方面和不利方面,Stonebraker提出了建议。这个分类用数据复杂度和根据特定任务查询适合的数据模型的相似复杂度作为参考。对于结构简单的数据和简单查询,存储在文件系统中的索引文件被认为是适当的。对于简单查询和复杂数据可以采用面向对象的数据模型。根据这个分类,关系数据模型应用于简单数据结构的复杂查询;而在查询和数据都很复杂时,要应用对象关系数据模型。后者是针对内容的,其结构相对复杂,因为工作流的量很大和需要支持的用例众多,其检索也相对复杂。

然而,除了要选择适合的数据模型和相应的数据库系统,还应考虑其他重要条件,例如,现有的数据库可能需要扩展或者要集成到内容管理系统中去。另外还应考虑现有组织中的专家经验,其中最重要的是备选数据模型方案要能够获取所有相关数据和程序。因此,开发内容管理系统的组织应该考虑到全面的特征、用例、工作流和过程,从而获取相关的元素和属性。另外,实体以及过程之间的关系和链接也应考虑在内。完成这些工作之后(考虑所有的相关实体和关系之后)才可以开发适合的数据模型。

内容管理系统具体的数据模型的核心是具有所有相关特性的内容对象、任务、工作流以及表征实体。数据模型要考虑所有相关对象的元数据。内容对象之间的不同关系和可能出现的互操作都表现在数据模型中。另外,具体组织的工作流步骤和不同用户的角色也应该反映在数据模型中。

4.2.2关于片段的元数据

除了描述对象的元数据,还有描述片段(传统的由时码控制或者由区域参数控制的片断)的元数据。片断描述的优点在于对内容对象进行深度编目的自由度和灵活性很高,它可以对重大事件的详细描述进行编目。另外,它能够支持对于内容对象具体部分的检索,并且能够定位到具体部分。

片段能够表示内容对象的不同逻辑部分。片段可以是根据空间的或者是根据时间的,前者是指内容对象的具体区域或者(如MPEG-4中一样)内容对象的某个具体对象;后者则指时间片段由对象ID和开始以及结束时码(或者开始时码和片段时间长度)为标识。媒体对象的时码以时间线为参考。

时间线可以是片段相关的逻辑构造。素材的物理时间线要联系到文档程序逻辑时间线上。标识任何副本上的具体片段的能力要独立于素材的存储格式以及内容的集成和组合之外。

利用时码进行内容的逻辑分解通常在日志页面进行,它给出了内容条目的图像描述。时码用来定位内容对象时间线上的特定事件。它以自由文本方式或者分类文档和词典方式来详细描述。

添加面向时间注解的有效概念是分层结构。分层结构以在界定整个媒体对象的各个部分分段处添加锚点的方式,来利用媒体对象的时间、空间本质特征,锚点处可以链接到详细的描述。例如,时间层结构应用时间参数(和各自的时间线有关)来指向音频或者视频对象的某个具体部分。然而,和传统的日志记录相反的是每个层可以有具体的主题和描述主旨。单个的描述可以集中在特定概念上,如图像描述、关键字、相似标题文本、出场人物等。每个层都可以根据与层的片段相关的时码来独立分段,这些片断不需要和媒体对象的其他片段或结构(如拍摄结构)相互关联。利用自动分析和特征提取工具,自动检索到的信息可以关联到以时码作为层限定的特定的层,这样就补充了以手动进行的文档编目。因此,利用文档分层法,专家们可以和自动生成的文档联合操作。

在连续媒体中,片段描述和与时间无关的文本信息以及与时间有关的视听信息相联系。一些多媒体内容管理系统联合应用视听信息和文本信息在情节串联图板中产生基于片段的文档。此时,关键帧、层的描述和时码联合产生图像内容的纵览,同时也连接到预览视频的一个副本。这种技术综合了不同媒体类型生成媒体对象的真正多媒体描述。

如关键字、相似标题文本、版权和图像内容描述等元数据,在不同层级被描述,每一层级有完全不同的时间线,只需保证有共同的参考点(即开始点)即可。

在检索过程中,联合的层有时要准确地标识出用户感兴趣的片段。例如,当要查找在特定地点某人在另外一个人在场时所做的发言,用户则可以查找“在场人”的层中参与者的姓名,查找“相关主题”层中引用的原文,查找“地点”层中具体的位置。联合输出的结果将准确指向需要的片段。

同样的方法可以应用于空间层结构。此时图像被分为不同的部分,然后单独描述,这些部分可以是对象或者只是媒体对象的某个区域。

编目和检索上的花费在很大程度上有赖于具体组织中对内容文档采取的策略。如果在文档组织上付出的努力能够让用户更快地找到需要的内容条目或者片段(或者查找全部),那么就可以提高文档的重用性。

4.2.3逻辑内容结构和内容层级

内容对象通常和其他对象以及其他层级的部分有联系,如节目集和节目系列。所以除了表示具体内容对象的元数据以外,这种结构和层级也要反映在内容管理系统中。可以定义以下的层级结构:

·镜头(如传输中的帧序列)。

·节目条目(组成大单元的单个实体,如新闻故事、采访、演出等)。

·节目(由逻辑相关的节目条目组成的节目块,构成相同传输或节目时间表实体)。

·节目集(相同生产的节目组,如电视剧)。

镜头由片段描述,节目条目由相关对象的元数据充分描述,然而节目和节目集需要单独考虑。描述节目的一种方法是利用相关条目的链接和相互关系。但是这样还不够充分,因为有关内容收集的元数据并没有在层级中表示出单个条目的特征,因此在很多情况下节目要以它们自己的方式表示成对象。

层级中不同对象的关系可以用层级树和关系图来表示。关系图用来表示更松散的关系,如关于某个事件或者主题的新闻故事组。从图中可以看到,根据不同的内容结构和组织,对象层级可以有多于两到三层。

开发这些层级关系可以定位检索到层级的具体某一级。例如,如果用户要检索整个节目,但是起始的检索结果是关于节目条目的,那么可以利用层级关系来找到所需结果的对象或者片段。

4.2.4对象引用

对象引用在内容管理系统中有重要地位,因为它们明确标识了内容对象。它们是元数据的一部分,但是将元数据与素材联系起来。除了将内容对象作为一个实体进行标识以外,它们也能够引用到不同的内容组件(如素材对象),将内容对象的不同表示链接起来。另外,它们还可以用于链接相关的内容对象。为了实现内容交换,这些引用要基于特定的标识。它们至少应该在组织中能被单独标识,在组织间也应该能够单独标识。此时就需要全局的、唯一或者注册的标识符。

区别系统内部标识符(如数据库密码)和内容对象的标识符是很重要的。前者只能标识具体系统中的对象,这在内容管理情况下是不够的,因为同一个内容对象在不同系统中会有不同的表示,每个系统注重于不同方面(如财务、知识产权、节目信息等)。由于对象引用表示对象不仅仅是一个具体的实例化,因此它们有更加广泛的应用。

除了特别标识内容对象之外,标识符可以包含关于内容对象来源的附加信息,其所有权、起始信息、注册团体等将被编码在标识符中,并有各种方案可供选择,以下列出一些:

·对象特性标识符,是本地组织内部的特性唯一标识引用。对象特性标识符的概念也可以用于简化遗留系统到内容管理系统的集成。这些标识符不能在定义范围以外通信和使用。

·唯一资料标识符(Unique Material Identifier, UMID),是为了标识素材条目而提出的。UMID由SMPTE定义标准化,其格式允许纯粹基于本地信息自动生成全局唯一标识符。即在该领域记录时就生成UMID。标识的粒度(同一UMID标识了多少视频帧和音频抽样)一方面有赖于预期使用,另一方面有赖于媒体存储元数据的能力。UMID也标识素材条目和节目条目以及相关素材之间的关系。

·唯一节目标识符(Unique Program Identifier, UPID),是为了传统的节目条目和相关版权的声明而提出的。UPID有法律意义,因此最好选择正式的、注册的标识符。例如,在国际标准视听数字注册机构注册的国际标准视听数字(International Standard Audiovisual Number, ISAN),就长时间拥有唯一标识符。在该过程中附加信息集合(如有关注册组织的)也被注册机构记录下来。

其他的参考程序是处理具体方面的问题的,特别是有关时间的,这对注册时间、创作、生产和传输事件是很重要的。例如,和时间相关的参考有:

·时间参考,是一般的结构化时间戳,它用来表示内容对象和真实世界或者媒体流的协调时间之间的关系。

·真实世界时间表述,是需要同步元数据和基于实时事件的素材条目所必需的。例如,当一些素材版本被单独获取的时候,它们能够通过和初始信息相关的获取时间日志而进行同步。因此,特别版本的索引可以利用真实世界时间表示,自动传播到其他所有版本。适合表征真实世界时间的格式,有关于参考时间或者地理时间的时间单元计数的格式或者是日期时间格式。前者通常由计算机操作系统实现,因为其支持时间跨度的简单计算;后者是人们可以阅读的时间和日期格式。

·媒体流时间,是以开始时间(第一帧)为参考点的具体内容对象为参考的相关时间。在得出的时间线中,事件可以以图示形式给出,例如关于时间的内容逻辑描述、时间片段或者组成元数据。如果UMID没有联系到帧,那么媒体流时间在条目中标识剪辑(如为了片段文档)的作用是很重要的。媒体流时间可以被表示为标准SMPTE时码或者帧单元或者样本单元的位移和持续时间。由于时间计算的基础和设备的内部时钟有关,所以,以上两种都不是真正有效时间的表示。这里还没有考虑设备的偏差。如果素材版本没有在有效时间控制下生成,那么描绘同一节目的不同素材版本的时间线是复杂的问题。例如,如果一个素材版本在播出中被记录,它的延续时间有可能和来源节目的时间不同,因为会有商业插入时间和淡入淡出时间等等。

有很多其他的对象引用内容对象的内部标识符。在内容管理系统中很重要的还有媒体定位器,它用来标识给定的条目(素材或者元数据)的位置。在基于IT的系统中,它们可以根据W3C的定义表示为统一资源定位符(Uniform Resource Locators, URL)。当引用到传统媒体时,物理地址必须根据统一语义赋予。在诸如内容管理系统这样的复杂系统中,推荐执行适宜的定位服务,这些服务应能跟踪内容对象从一个地址到另一个地址的移动。

4.3获取和交换元数据

元数据的作用是使得内容可访问、易于查找和可以交换。尽管在某些情况下,元数据包含的很多信息可以独立存在,但总的来说,它是用来支持交互功能和实际媒体或者素材的处理过程的。因此,元数据的综合查找、检索和交换对内容管理系统中的交互作用很重要。

4.3.1元数据的检索和查询

内容管理系统要提供特别的查找功能,以便能够获取与内容管理系统进行互操作的不同数据库和信息系统的信息。大多数用户不能熟练使用数据库也不熟悉数据模型或者内容在数据库中的表达。另一方面,对于专业用户,如存储人员和媒介管理者,他们使用原始的数据库查询能最快得到结果。因此,系统应提供不同的查询元数据的方法。以下介绍几种查询方式:

·全文检索,支持以自然语言检索系统。查找通常经过索引后的文件(有时候是结构化文件)或者使用DBMS的全文检索功能进行。

·检索标签,构成了根据内容进行检索的结构,如根据名称、地点、日期等。这些概念在不同的数据库中标出了相应的属性。如果元数据存储在结构化文档中,标识过的元素也在查找范围内。

·检索片段,只在片段描述中进行查找。如果使用了分层的文档模型,也可以限制在表示具体层的概念中查找(如出现的人物和地点)。

·本地检索,是直接应用于本地数据库的查找,考虑了数据模型、检索语言、数据库的具体限制和功能。

从很多数据库和信息系统中检索数据的操作是普遍的,所以需要支持联合查找和确定结果。如果内容对象归档在多重系统中,那么结果的确定通过ID匹配来进行。结果显示给用户的方式有赖于用户的角色和应用的角色。数据库和全文检索引擎可以用其本地接口进行检索。利用XML消息传递来转换信息是另一种取得该类信息的可行办法。

同类推荐
  • 明代宗族研究

    明代宗族研究

    宋以后新宗族形态的重要特点是组织化,明代则是这一新宗族形态承上启下的重要历史时期。本书依据大量的明代文集、族谱、方志等万史文献,从整体上综合性地把握宗族祠庙祭祖形态和演变,深入研究宗族制度与乡约推行的关系,着力论述士大夫重建宗族的理论探讨与具体实践。作者考证了明代宗族祠庙祭祖制度及其演变,注意区分明代不同时期不同地区的祠庙祭祖形态,提出宗族乡约化的概念,把宗族活动放在宋以后士大夫的化乡实践中认识,对著名宋濂、杨士奇、罗钦顺的宗族思想进行了探讨。本书是第一部研究明代宗族问题的学术专著,对于探讨明代社会文化史有着重要的参考价值。
  • 守护教育的良心

    守护教育的良心

    《守护教育的良心》这是一本有痛感又饱含温情的书。作者厉佳旭,从青春勃发的大学生,变成双鬓染霜的老教师,一晃二十年。他在多所学校工作过,一直保持着多年来养成的自我批判的习惯。本书记录的,是他最真诚的教育反思。如何理解教师这份职业?如何认识学生?好学校长什么样?如何看待生命和自我?如何理解今天的中国教育?如果对一切熟视无睹,便不会进步。作为校长,更作为一名教师,作者用自己的思考呼吁教育良心,用自己的行动守护着教育良心。本书献给所有热爱教育的人。
  • 哈佛东方新秀

    哈佛东方新秀

    本书只是想以海雯步入哈佛的成长历程为线索,介绍培养海雯的一些经验和方法,介绍海雯切实可行的学习方法和人生设计,以点带面,抛砖引玉,并以我的所见所感为视野,介绍美国的家庭和中小学教育,以及美国的教育体系、教育政策,教学、考试、评估学生的方法和道理等。这些都集中体现了美国的文化意识。希望每位父母、学生和教育界人士在阅读本书后对中美文化、教育及思维上的差异有相对比较全面的认识,能开阔一些视野,从中受到启发,并结合中国教育、文化的实际情况,取长补短,把东西方文化结合起来,用于培养中国的孩子,培养更多更好的未来世界先进的高素质人才,使我们中华民族永远自立于世界民族之林。
  • “事功”教育思想与教育论著选读

    “事功”教育思想与教育论著选读

    教师职业化、专业化是当今世界教育改革共同关注的热点和焦点问题之一。教师职业素质素养达到基本要求和提高, 是当前教育改革和课程改革的急迫要求。为此, 我们组织相关专家重新系统地、较完整地遍选、编译、评注了这套适合中小学教师职业阅读的《中外教育名家名作精读丛书》
  • 互联课堂引领教学革命:基于上海市嘉定区实验小学的研究

    互联课堂引领教学革命:基于上海市嘉定区实验小学的研究

    当下,信息化教育已成气候,尤其在上海这样一个领全国教育风气之先的信息化都市。然而,基础教育阶段信息化手段的应用仍显不足,且一直以来因平面化、形式化等问题屡受诟病,实施情况并不理想。本书立足于嘉定区实验小学“互联课堂”项目的成功推进,分学科介绍信息化手段在教学中的设计和应用案例,既有理论高度,又有实践意义,其所授经验,足资借鉴。
热门推荐
  • 万古神帝

    万古神帝

    八百年前,明帝之子张若尘,被他的未婚妻池瑶公主杀死,一代天骄,就此陨落。八百年后,张若尘重新活了过来,却发现曾经杀死他的未婚妻,已经统一昆仑界,开辟出第一中央帝国,号称“池瑶女皇”。池瑶女皇——统御天下,威临八方;青春永驻,不死不灭。张若尘站在诸皇祠堂外,望着池瑶女皇的神像,心中燃烧起熊熊的仇恨烈焰,“待我重修十三年,敢叫女皇下黄泉”。
  • 致上青春

    致上青春

    青春总是如此匆匆,就如《匆匆那年》的那些回忆。青春是痛苦、是快乐、是成长的一个过程,也行我们在青春里后悔过、迷失过、努力过、笑过、哭过、疯狂过、无忧无虑过。致那年我们的青春、致那年我们的友情、爱情、回忆的点滴………《致上青春》是由几个故事合成的,有在青春中欢笑、流泪的、痛苦的。有在青春后成长的、成熟的。曾经,我也在青春里疯狂过。就像所有的少年一样,疯狂总是青春中不可缺少的。经历过一切不一定能在风雨中看到未来的什么,只能看到我们的坚强、和在风雨中的成长。
  • 阳光正好你不在

    阳光正好你不在

    楚林,你是我的太阳,那样耀眼的存在,仿佛穿过了漫长而黑暗的隧道后看到的第一缕光,美好的让人本能向往。对不起,尹晞宸。我只能拿你当哥哥。
  • 灵魂深处的感动(让学生感受亲情的故事全集)

    灵魂深处的感动(让学生感受亲情的故事全集)

    亲情如一首永远唱不倦的老歌,古老的曲调中饱含浓浓的真爱;亲情似一杯淡淡的绿茶,虽不浓郁但却散发着淡雅的醇香;亲情似大海里的一叶小舟,于惊涛骇浪中承载着风雨同舟、不离不弃的誓言。拥有亲情,便拥有了世间一切的美好,让这浓浓的爱、悠悠的情化作一缕春风,吹来桃红柳绿,吹开心底似锦的繁花……在最无助的人生路上,亲情是最持久的动力,给予我们无私的帮助和依靠;在最寂寞的情感路上,亲情是最真诚的陪伴,让我们感受到无比的温馨和安慰;在最无奈的十字路口,亲情是最清晰的路标,指引我们成功到达目标。
  • 让孩子更聪明的成长故事(青少年心灵成长直通车)

    让孩子更聪明的成长故事(青少年心灵成长直通车)

    《让孩子更聪明的成长故事(青少年心灵成长直通车)》包括百变的老鼠、生死较量、鹰的回答、和老虎对视等成长故事。
  • 重整纪元

    重整纪元

    公元3124年,称为“天人”的异界大陆物种降临地球,自此以后,人类以“肥料”之名渡过了整整三千年。秦铮,一个普通人类,从十五岁起被关押在天人监狱,二十五岁被判处死刑,来到天人大陆,他逃过死劫,而作为代价,将要和天人少女共同打破两个不同物种之间的桎梏,重整纪元。重整纪元?那是一个看似虚无缥缈的目标,却又是一个人类神话的伊始。
  • 神游之夺宝传奇

    神游之夺宝传奇

    一次意外,左小南得到了一枚来自异界位面的戒指。没钱?小case,左小南随手从戒指中扔出一颗拳头大小的七色夜明珠。喏,去拍卖行随便换个2000万玩玩。什么?皇室收藏了一个水晶头骨?喏,去告诉那个70岁的国王,只要交出咱们想要的东西,俺就让他的那个再“挺”50年。靠,要带我一起去异界位面?别介,俺现在飞天有私人波音777,入海有私人航空母舰,在索马里海域还有近万亩的私人豪华岛屿,走哪都有一群堪比超模的mm相随!跑到你们异界去升级、炼器、打怪?拜托了……你以为老子的脑袋被驴给踹了???
  • 不小心爱上你:鹿晗

    不小心爱上你:鹿晗

    一场穿越让他们正真相爱,在现代也许他们已经互相爱上对方,可能他们不知道。在另一个世界里到底会发生什么奇遇呢......
  • 鬼王是我小老婆

    鬼王是我小老婆

    魅惑众生的九尾狐狸?吸人精气的合欢树妖?道家妹子求双修,仙家女神若即离。游走在这些危险分子中间可不是容易的事情。但为了世界和平,少年王小明豁出去啦!
  • 帝尊的绝色宠后

    帝尊的绝色宠后

    “好漂亮的大姐姐,好像天神啊!大姐姐,这娃娃是你的吗?你为什么把她放在楚伯伯家门口?你可不可以把她送给赟儿?赟儿好喜欢!”“我娘亲和我说男人就只能给自家的娘子买礼物。你要是愿意和我拜堂,做我娘子,我就帮你买。”“啊,瞎眼啦!娶了一个刁蛮的小婆娘!”“苓丫头,对不起。这可能是赟哥哥最后一次保护你了。日后苓丫头要学着自己坚强。”“丫头,好好活着!”“师妹,在我们那里,一个男人只能娶一个女人。若是师妹愿意,瑾瑜愿与师妹一夫一妻。”“师妹,地球是银河系中最美的星球。”“师妹,你知道什么是魂穿么?瑾瑜不是什么皇子。瑾瑜是千年以后,地球的中国人。”“若是有前生今世,瑾瑜前世,一定见过师妹……”