登陆注册
14253100000016

第16章 素材(6)

3.5.2.1SGML

标准通用标记语言(Standard Generalized Markup Language, SGML)是由美国出版协会支持开发的。它的基本思想是文本的书写不含有任何格式,而使用标记来标明标题、段落等文本元素。利用SGML可以实现文本显示的灵活可变性。标记结构对文本文档的自动处理也很有利。SGML定义了一个框架,在这个框架中定义了标记的语义,标记的出现频率和解释留给处理SGML文档的应用程序来进行。SGML是面向对象的,包括类、对象、类和对象的层级及继承等。它还允许指定SGML文档的处理指令信息。

文档的分析和格式化过程是分开的。标记决定了文档的结构,而显示的部分也常和结构有关。因此,格式化文档时要考虑文档设计的内容。

SGML中定义了4种标记类:

·描述性标记,决定了文档的结构,形式为〈start-tag〉文本元素〈/end-tag〉。

·实体引用,是在显示文档的时候代替实体元素的引用设定。

·标记声明,定义能够被进行引用的实体。

·处理指令,是和格式化指令一样的程序指令,并且能够支持在文本显示的同时显示其他媒体类型,如音频、视频。

SGML只定义了语义,而文档类型定义(Document Type Definition, DTD)则定义了句法。文档风格语义和规格语言(Document Style Semantics and Specification Language, DSSSL)则规定了显示标准。

3.5.2.2网页和HTML

随着万维网的普及,内容管理系统更加需要管理好网页文本。网页是包含文本、图片、图表、声音和视频元素的电子文档,甚至还有一些小的可执行程序。这些文档存储在服务器上,从而用户可以进行检索。网页的不同元素不需要在网页内部被编码,但是可以链接到相关网页。因此,一个网页可能需要链接很多相关的素材元素。为了在内容管理系统中管理网页,需要定义扩展文档。例如,与网页有关的图片、视频或者音频可以被当作是文档的一部分,而到其他页面的链接可能在现有结构之外,只需当作引用项目。因此,用内容管理系统处理网页时,确定结构深度是很重要的。例如,相关的链接元素的范围应包含在存储和管理的处理过程之中。

网页是由超文本标记语言(Hypertext Markup Language, HTML)制作的。HTML是一种定义了如何显示文档的简单标记语言。与SGML文档相比,HTML文档是由标记构成的结构简单的ASCII文本,这些标记可以被认为是控制命令。HTML文档结构由3部分构成:文档类型定义、文档头和文档主体。在HTML文档中可以编码元信息,它不显示给用户但是可以用来声明作者信息、版权信息,或者将网页信息提供给Web搜索引擎。

HTML中可以使用所谓的样式表来声明元素的显示方式。应用样式表来分开实际内容和显示内容。层叠样式表(Cascading Style Sheet, CSS)可以精确定义网页的显示格式。内容管理系统同样也要管理网页的样式表,HTML对样式表的引用也要被正确管理。

3.6素材的处理

素材的处理包括视音频、音频和视频对象的自动管理,可被用作附加元数据的信息检索以及便捷的输入和检索过程。相关的工具有:视频分析工具、音频分析工具(如语音转为文本的工具和关键字定点)或者图片相似性检索工具。该类的其他程序有:转码工具或者将素材分段的特殊工具。

3.6.1素材处理的应用程序和服务

有很多工具支持素材处理和语义信息的自动检索,不同工具针对素材处理的不同方面。不仅它们的处理精度在内容管理中十分重要,它们是否能够或者怎样被应用于内容管理系统中也是很重要的问题。

总体来说,相关工具是应用型或者是服务型。它们完全自动地处理素材,并可以将这些工具根据其处理的特定媒体的具体性质和特征进行分类,从而提取出语义信息。

·内容分割(时间和空间)工具和应用程序:根据具体参数如镜头数(时间分层)、特定区域,或者图像中的对象(空间分层)将连续媒体对象分割。

·元数据生成工具:根据特定素材对象的特性或者可分析的特征(如运动检测)来产生元数据。

·自动内容描述工具:如语音标识工具,根据语音或者检测的关键字生成清楚的显示描述。

·索引工具:根据最普遍的模式对素材对象进行分类,如面部标识工具和程序分类工具。

·基于内容的检索工具:利用素材的特征进行内容查询,如画面相似性检索。

3.6.2素材的处理:基本原理和方法

大部分的素材处理工具是利用数学、统计或者不同媒体的某些可计算特征和属性的随机分析方法。它们对文件、声音、图片或可视视音频信号进行整体操作或者在给定时间内对特定部分分别操作。素材处理过程的基础构成部分有:

·特征提取。

·特征解析。

·查询引擎。

特征提取部分包括所有的处理原始视听材料和利用对象化的手法提取低水平特征的处理过程(如色彩直方图、频谱分析以及主要动作幅度分析等)。通常来说这些特征并不传递任何能被人们直接认知的信息,因此需要更进一步的处理。特征解析部分就是完成这方面工作的,它能解析特征或者特征组合的值(在一定出错范围内),尽量将目标观察和逻辑判断进行匹配(如画面的上半部分主要是浅蓝色的,下半部分主要是绿色的,因此判定它是在户外拍摄的)。这种操作可以对某些内容特征进行人们可以理解的描述,但是这种解析要基于某些试探方法,因此有可能导致错分类。更多先进的方法考虑了媒体的语义方面。

另一种直接应用音频、视频和视音频素材的低水平特征的方法是相似性检索。此时用户要求搜索引擎检索与已给定信息相似的信息条目,然后引擎根据用户提供的信息提取特征值,并与已检索的内容进行特征分析和提取后存储的特征值进行相似性匹配。这也包括从对象相似性度量的比较中提取的相似值。低水平的工具和一些同样考虑内容语义的高水平的工具共同使用,可以得到更加准确的结果。

声音和音频分析是应用随机分析对声音效果、光谱封装和音素进行操作。大体上它可被分为一般声音处理(发现和分类流中出现的声音)、音乐分类(乐器类型和主题识别)和语音分析(提供语言监测和标识、语言定义、关键字标记和脚本翻译)。例如,语音标识就使用了声音指纹鉴定方法。语音分析的原理是基于不同特征值的比较。将音频流中提取的特征值和用户例子的相关值作比较,从而识别出一个说话者或者词。语音分析过程有3个步骤:

·声音和音素分析。

·句法分析,从声音分析中改正错误。

·语义分析,也帮助改正错误。

依赖于说话者的声音的分析引擎通常产生的效果比不依赖说话者的分析工具要好,这是因为可以使用附加参数。总之,没有哪种语音分析工具可以产生100%正确的效果。

静态图像分析是用色彩特征分析、区域分段、文本特征分析和面部检测(可以被认为是特殊的文本特征分析)来得到图像内容的信息。图像标识技术有广泛的应用,如应用在OCR工具或者手写文字标识中。图像标识技术的3个特征是色彩、文本和图像边缘。可以根据这些特征的相似性来查找图像,或者根据某些特征的出现频率利用统计或者随机方法来标识图像。但是这些纯粹的技术分析方法并不能揭示图像确切的内容和语义,还需要知道对象在图像中的位置和区域。

图像标识过程有6个步骤:格式化、背景分析、标识、分组、提取和匹配。背景分析过程评价了信息模式并且清除干扰(噪波);接下来标签标识了信息模式,把它分成单元,组成一个可视化实体(主要使用边缘检测方法);分组步骤将单元组成的实体组成为更大的实体;在提取步骤中,从每个在分组步骤中产生的实体中提取出一个参数列表(如区域、方向、空间和环线位置等);匹配步骤匹配标识实体和已被认知的对象,这最后一步决定了图像中不同的相关对象的翻译。

视频分析工具使用为声音和图像分析开发的分析机制来进行基本分析,它还使用视频序列中的运动信息来决定视频的特定事件。例如使用场景转换、消解和擦除等效果和效果检测来决定视频中的拍摄转换。使用这些信息可以产生一个原始的剪接列表。某些效果,如消解和擦除效果,甚至很难和其他视觉效果区别开来,因此,它们的准确率比简单效果要低很多。可以将运动和轨道评价用于决定视频中对象的运动。所有这些信息可以用于产生视频的可视化摘要。当画面内容中有很大变化时会提取出关键帧。此时的情况与人的视觉感受没有很大关系。例如,在体育场的场景中包括很多运动,画面表现也就有很大不同,然而这些信息并不一定是相关的。提取出的关键帧可以以多种方式排列以给出视频内容的快速预览。此时经常运用情节串联图板或者马赛克技术。

另一种由视频分析产生的可视化摘要是所谓的浏览。它们是基于视频分析结果的简单视频摘要,如编辑在一起的简短的视频片段,可以给出视频内容的快速预览。更复杂的工具甚至考虑了伴音和单独的音轨的编辑以产生连续的视音频摘要。

3.6.3内容管理系统中素材的处理工具

富媒体组织中需要处理的内容数量越来越多,因此使用自动处理过程来支持内容的标识和存档就变得更加重要。音频、视频和图片由基于计算机的工具和应用程序自动处理以提取语义甚至基本句法信息的特性。然而提取出的信息并不是100%正确的,因此需要仔细考虑处理素材的工具在什么环境中配置、它们提供信息的准确率的高低、还要附加什么人工操作和过程来更有效地使用这些工具和应用程序。目前只有辅助设备提供存档处理,而且还需要专业操作人员来运用。

内容的检索也可以由自动处理程序支持,如图像相似检索和蜂音搜索。此时需要重点考虑用户的需求。例如编辑或者记者检索一个图片数据库,使用样本图片查找一位政治人物的图片,它需要检索到在不同时间、从不同角度拍摄的同一人物的照片。然而目前大多数工具会返回包含相似形状、文本和颜色的图片,有时甚至和要检索的人物图片相去甚远。为了避免这种令人失望的情况,需要管理用户的需求,而且这些工具要用在真正适合使用的地方。

另一个需要考虑的情况是如何将自动处理工具和应用程序用于内容管理系统结构中。它们将文件、数据流或者视音频信号作为输入部分,产生的结果是关键帧集合、视听材料或者元数据信息。这些结果必须和实际内容对象相联系,并要能够在内容管理系统中被处理。另外,如图像相似性检索引擎等工具可以产生内容对象的命中清单。这些命中清单需要与存储在内容管理系统中的实际内容对象相关联。因此自动处理工具和应用程序只有在全面集成于内容管理系统中才能真正发挥作用。

同类推荐
  • 隔墙有耳

    隔墙有耳

    本稿件并非要釜底抽薪,去探讨人权和隐私等跟告密相关的问题,只是希望通过讲述告密史上一些人和事来让人们欣赏一下,这些古代肮脏的幽灵到底给他们自己和历史带来了什么,他们那种为告密而不要脸,甚至是不要命的“勇敢行为”是怎么修炼成的。
  • [欧洲]中世纪教育思潮与教育论著选读(上)

    [欧洲]中世纪教育思潮与教育论著选读(上)

    教师职业化、专业化是当今世界教育改革共同关注的热点和焦点问题之一。教师职业素质素养达到基本要求和提高, 是当前教育改革和课程改革的急迫要求。为此, 我们组织相关专家重新系统地、较完整地遍选、编译、评注了这套适合中小学教师职业阅读的《中外教育名家名作精读丛书》。
  • 城镇化:中国与欧洲

    城镇化:中国与欧洲

    本书是中欧社会论坛多年组织中国与欧洲城市建设参与者与城市问题专家多层面、多形式的对话、讨论的记录和成果的展现,以中欧互动的视角解读中国新型城镇化面临的机遇与挑战,希望通过推介欧洲城市进程中的经验与教训,引进当代欧洲对自身城市化的反省及对未来城市发展的思考。
  • “洛学”教育思想与教育论著选读

    “洛学”教育思想与教育论著选读

    教师职业化、专业化是当今世界教育改革共同关注的热点和焦点问题之一。教师职业素质素养达到基本要求和提高, 是当前教育改革和课程改革的急迫要求。为此, 我们组织相关专家重新系统地、较完整地遍选、编译、评注了这套适合中小学教师职业阅读的《中外教育名家名作精读丛书》。每种含教育家的生平、教育事迹、教育成就、教育思想评析和经典教育论著选读及注解解读导读两部分。这对于全面深刻和原原本本地了解学习、运用教育家的思想和著作是十分有益的。
  • 人文教育读本

    人文教育读本

    中国传统文化由儒、释、道三家,文、史、哲三科,天、地、人三学合构而成。在这种传统文化基础上孕育出来的传统人文精神,主要体现在三个方面:在人与自然的关系上,顺自然而以人为本;在人与社会的关系上,循人伦而以和为本;在人与自我的关系上,重体验而以乐为本。中国传统文化中蕴含的这些人文精神,在现代社会条件下仍然适用,也趋同于国家、社会、学校思想政治教育的目标。
热门推荐
  • 修宝

    修宝

    谁说没有灵根的普通人就不能比修真者强?修真者的经历告诉我们,只要活的够久,有一点提示,而且能坚持到底。任何人都可以悟透大道,破空飞升。一位地球上的普通宅男死去后转生为修真界凡人,由于没有灵根,他从小被修真者嘲笑,于是他立下了以凡人之躯登上修真界力量顶点的宏愿。后来他无意中和另外一个时空的宝物融合,从此走上了一条不同寻常的前进之路。别人怕杀戮影响了道心,而主角没有战斗就无法进步。为了达到那最高的顶点,主角只好选择将战斗进行到底。(希望各位书友喜欢这本书。)
  • 聪明女人一定要知道的66个法律常识

    聪明女人一定要知道的66个法律常识

    本书以中华人民共和国之最新法律法规为您解答生活中应该了解的法律知识。恋爱中的花销属于债务吗?感情不和分居两年可判离婚吗?离婚时两周岁以下的孩子一般可随母亲吗?怀孕或刚分娩后男方可以提出离婚吗?为公婆欠的钱,离婚时也要偿还吗?为什么要与用人单位签订《劳动合同》?试用期超过6个月违法吗?企业不签合同可获双倍赔偿吗?业主被盗物业要赔偿损失吗?景点逛少了,旅行社要赔钱吗?产品质量诉讼时效是多久?不给发票可以不埋单吗?网上证据公证保全才有效吗?婚纱照丢失,可获精神损失赔偿吗?实物与说明书不符可获赔双倍吗?赠品有问题也能获赔吗?
  • 轩辕武帝

    轩辕武帝

    修炼大山争道路,只为寻得万人尊。千古渊源遇良师,拼命修炼筑神体。爹娘无踪泪人泣,风起云涌静心狂。一心闯荡离家走,红尘奇爱满香怀。我的未来,不会平凡!(求关注!)
  • 四斗二十八宿天帝大箓

    四斗二十八宿天帝大箓

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 人间灵案

    人间灵案

    许多人都不相信这个世界上会有鬼,但是在我认识了他之后,我却相信了这个世界上真的有鬼。马祭,一个捉鬼侦探,我也是第一次听说这个职业。我想许多人跟我一样,在第一次听到这个职业的时候觉得这纯粹是鬼扯。但是我就是那么幸运,跟着马祭这家伙去捉了第一次鬼,吓得我半死不活,这我才信了。
  • 武士的反抗

    武士的反抗

    四百年前,冥想术突然出现在君兰的城墙上,新的修炼体系-魔法横空出世,大陆格局发生了巨大变化。四百年后,已成规模的法师,渴望更大的话语权,向有着数千年历史的武士阶层,发起了冲击。正所谓时势造英雄,千年未有的乱局,谱写了一个又一个的慷慨悲歌。
  • 网游之十神器

    网游之十神器

    22世纪一款全息仿真游戏的开创,在全球引起轰动。尚小雪得到梦寐以求的登入器,她带上之后脑电波被带入游戏亲身体验,不料一进去就发生游戏BUG,一系列系统失灵、瘫痪、崩溃,她无法退出游戏,只能被迫继续游戏。更加恐怖的是,游戏里的怪物居然追杀玩家,攻城掠地,连游戏11C都不放过,游戏世界陷入了空前的混乱。尚小雪和其他玩家一路逃亡,在绝望中她得知了更加绝望的消息。游戏超过72小时,玩家将会陷入超深度睡眠状态,换个通俗点的文字表达就是——变成植物人。玩游戏却要变成植物人,还有见过比这更悲催的事吗?尚小雪快发疯了,为什么会变成这样?到底是出了什么问题?她一无所知。作者语:如果喜欢本作,就请收藏、推荐、鲜花、评论票支持一下新人,请给新人一个站上舞台的机会!
  • 杂著:(方立天文集第十卷)

    杂著:(方立天文集第十卷)

    今年是方立天先生从教五十周年,明年即将迎来八十大寿,值此欣盛之时,结集以为纪念。方立天先生为人可敬,为学可信,毕生孜孜矻矻,专注于中国哲学、佛学与文化的研究,著作颇丰,影响非凡。本文集共12卷,凝聚方先生一生心血之作,堪为集大成,在中国哲学与中国佛学研究领域,具有承上启下、继往开来的关键意义。
  • 曼哈顿的黄昏

    曼哈顿的黄昏

    2017年10月16日傍晚,纽约曼哈顿美丽的日落。上纽约湾的一角,海水有节奏地冲刷着棱角分明的山崖岩壁,飞溅起大团的白色浪花。一座巨大的西式庄园连绵起伏地覆盖在这片巍峨的悬崖上,庄园里面,不断地传出节奏感十足的欧美流行摇滚乐与各种疯狂的欢呼,数道彩色的光柱随着节奏喷射在各个角落.到底这座能跟皇家园林媲美的私人庄园里面在庆祝些什么?
  • 中小学生数学爱好培养丛书:必做的数学游戏

    中小学生数学爱好培养丛书:必做的数学游戏

    数学是研究数量、结构、变化以及空间模型等概念的一门学科,是透过抽象化和逻辑推理的使用,在计数、计算、量度和对物体形状及运动的观察中产生的一门学科。基础数学知识的学习与运用是个人与团体生活中不可缺少的一个重要组成部分。然而,对于这样一门重要的学科,一些同学却视为畏途,兴趣淡漠,这使一些教师、家长乃至专家、学者大伤脑筋。事实上,“兴趣是最好的老师”,对任何事物,只要有了兴趣,就能产生学习钻研的冲动,就能取得理想的效果。兴趣是打开科学大门的钥匙,中小学生对数学不感兴趣的根本原因是没有体会到蕴含于数学之中的奇趣和美妙。