登陆注册
14253100000015

第15章 素材(5)

3.4.2.3MPEG-4音频

MPEG-4为语音编码、通用音频编码、音频语义和语音合成定义了一种扩展工具。MPEG-4音频(和视频部分相似)是面向对象的,它支持音频场景通过多重音频对象(语义的或者自然的)而创建。和MPEG-1以及MPEG-2中定义的一样,自然音频对象是从样本波形中产生的。和视频的方式相似,不同的音频流组合成为一个音频场景。

语音编码部分是特别为口语单词的有效编码设计的,它可以节省带宽、优化网络通信能力和节省存储量。因为只有语音需要编码,所以可以使用更有效的编码技术,其中杰出的有代码激励线性预测方法(Code Excited Linear Prediction, CELP)和MPEG-4谐波矢量刺激编码方法(Harmonic Vector Excitation Coding, HVXC)。CELP所产生的比特率是4~6kb/s,而HVXC编码的比特率是2~4kb/s。

MPEG-4标准的一般音频部分是将自然音频输入信号的重新制作。MPEG-4的代码部分基于MPEG-2优化编码技术,具有更好的压缩能力和纠错机制。而且它还支持很低的比特率和非常低的延迟。另外,它利用大步骤的可伸缩音频编码和比特分割编码算法实现了比特率的可扩展性(例如在接受有效信息时,还可以解码比特流的子集)。

MPEG-4还定义了音频的类、级和对象类型,具有通用音频、语音、语音和通用音频、语意音频和语意语音的扩展类型列表。

MPEG-4音频类定义了比特流和解码器的一致性范围。MPEG-4中定义的类比对象类型要少。MPEG-4的音频级是根据复杂度单元来定义的(处理器和RAM的复杂度)。MPEG-4还限制了特殊类型的对象,作者可以在一个音频场景中以不同的复杂度来使用不同的对象类型,只要总体复杂度不超过所定义的该级的复杂度。

3.4.3内容管理系统中的音频格式

标准音频格式(如44.1kHz和48kHz的PCM编码音频和MPEG音频)的带宽和存储要求比同样类型的视频要求要少,因此被认为更易管理。然而,这些格式同样要被整合到内容管理系统中,并且内容管理系统要对其制作和传输所需的工具和应用给予支持。

MPEG的音频编码器支持整个范围的声音压缩,其中最主要的是MPEG-1的第3层(MP3),因为它是目前网上流行的音频格式。基于MPEG-4的音频系统的相关性是显而易见的,同样也存在其他方式的音频编码格式,如Real音频或流式音频。然而,随着MP3的风靡,它们的实用性已经减弱了。

对内容管理系统的另一个挑战是具有更高抽样率和量化区间的新格式的出现。在专业系统中,96kHz的抽样率将可能成为标准。内容管理系统在处理音频和处理视频时的情况一样,必须应付多种多样的格式和需求。

3.5图片、网页、文本和其他素材格式

除了视频和音频,内容管理系统还要管理其他很多媒体类型(主要是离散媒体类型)。与视频、音频的情况相似的是,图片、图表和文本等的媒体类型都有很多种格式。例如文本文档就可以被编码为无格式ASCII文本、Microsoft Word、FrameMaker、RTF和PDF等。另外,内容管理系统也需要管理一些表示幻灯片、项目计划或计算表单等需要特殊(通常是私有的)格式编码的文本文档。此时内容管理系统的主要功能是索引这些文档以使它们能被检索,以及集成本地应用程序或应用视图以为用户提供原始形式的文档。文档查询索引的问题由可处理多种格式的全文检索引擎来解决,提供本地应用程序和视图的问题要结合第三方的应用综合解决。

内容管理系统管理的其他重要的素材类型是网页中的图片和结构化文档。

3.5.1图片

图片是可视化的照片或图像。它们描述具体的二维情形,没有时间限制(它们属于离散的媒体类型)。在内容管理系统中,图片由数字图片格式或指向外部图片的链接来表示。本书中只讨论相关的数字图片格式。在技术层面上,图片被认为是平面区域每个点的光线强度功能值的反映。为了数字化地表示这些值,需要对它们进行抽样和对抽样值进行量化。数字图片本身就成了表现量化值强度的数字值矩阵。图片的抽样点是画面元素(如视频中),即像素。图片的数字表示可能会很大。一张和NTSC制电视画面大小一样的图片的分辨率为640×480像素矩阵。以8比特和256灰度水平存储该单色图像需要空间大小约为300kB,因此和在视频中一样,需要压缩图片来减少表现时需要的比特数。最常用的图片格式是JPEG、GIF、TIFF和BMP。

3.5.1.1JPEG

JPEG标准是由ISO和CCITT联合组成的联合图片专家组制定的。JPEG定义了彩色和单色图片的编码和压缩方法,以及含有实际图片数据、编码表和编码参数的交换格式。如果编码器和解码器在相同环境中使用,就不需要编码表和编码参数。

JPEG标准具体化了4种基本模型(每一种还有变体):

·缺失序列DCT基本模型,即每个JPEG工具都支持的基本处理模型。

·扩展的缺失DCT基本模型,是对基本处理模型的增强。

·无损模型,支持原始图片信息的精确复制和重组,但是压缩率低。

·分层模型,包含不同分辨率的图片,并应用以上3种JPEG模型的算法。

这些模型的基本编码和压缩步骤相同。不是每个模型都应用所有的技术,如基本处理模型用分块、MCU、FDCT、步长和霍夫曼编码方法。

JPEG定义了一种很普遍的图片模式。图片准备阶段的源图片由至少一个、至多255个组成部分或者平面组成。这些组成部分的像素可能不同,如它们可以表示不同颜色(RGB)、明暗或者色度信息(YUV)。像素的表示也是可变的,每一个像素由值为0到2P-1的P个比特来表示。图片的所有组成部分的所有像素要以相同数目的比特数编码。JPEG缺失模型中每个像素用8或12比特表示。无插帧数据单元的处理命令是从左到右、从上到下,然后未压缩的图片样本被归组成8×8像素的数据单元。

基准模型的图像处理在8×8的像素组中,使用前序离散余弦转换(前序DCT),将二维图片值映射至频率域内。这种转换要进行64次,这一步之后所有DCT的系数要用64个输入口的量化表进行量化,每个输入口对应一个DCT系数的量化。量化和DCT过程都是有缺失的。接下来应用熵编码,在基准模型中的熵编码使用霍夫曼编码方法。

扩展的缺失模型支持高抽样精度(最高12比特)。另外,还使用了扩展的量化方法,从而实现渐进式代替顺序的图像显示。前者使得图片更加清晰,后者使得图片自上到下显示。扩展的缺失模型可以使用熵编码。

在无损模型中,预备处理的图像的每个像素的数据单元每像素精度在2~16比特之间。处理和量化步骤是基于根据相邻样本预测样本值的预测技术。

3.5.1.2GIF

图形交换格式(Graphic Interchange Format, GIF)最初由CompuServe开发,以支持与平台无关的图片交换。GIF使用无损压缩方案,支持在一个文件中插入多幅画面。

GIF图片总是编码为比特流。逻辑屏幕描述符定义了编码过的图片大小、位置和色彩表类型,而且也定义了可操作的全局、局部色彩表和指向该表的像素色彩指针。像素色彩用特殊的算法压缩(称为Lempel-Ziv-Welch),该算法可以检测和处理可变长度的比特模式。该比特模式在表中以短比特的形式表示,出现频率最高的比特模式以最短的比特表示。

GIF图片由以下部分组成:

·头,包含GIF ID和算法版本号码。

·应用部分,支持生成图片的程序的版本和名称信息编码。

·尾部,标示GIF流的结束。

·控制部分,控制后续图片块的显示。

·图片部分,包含图片头、可操作的色彩表和像素信息。

·注释部分,包含每个图片块的附加(文本)介绍信息。

·平面文本部分,支持图片中出现的文本信息的ASCII编码。

在GIF图片中,控制部分、图片部分、介绍部分和平面文本部分可以重复和排列。GIF也支持简短动画和图片序列的编码。GIF只适用8比特的色彩表,所以不能应用于高质量的图片。

3.5.1.3TIFF

标签图像文件格式(Tagged Image File Format, TIFF)是微软公司和Aldus公司联合开发的。TIFF的目标是提供可移植的、与硬件无关的图像编码。它有2个组成部分,称为基准部分和扩展部分。基准部分定义每个解码和显示的应用程序都必须支持的一些特征,扩展部分定义其他的附加信息。TIFF支持在很大范围内的色彩模型:从黑白图像到单色图像再到复杂色彩图像、RGB图像等。与GIF相似,TIFF也有以下几个部分:

·头字典,定义字节顺序、版本号码以及含有其他图片或部分的参考信息。

·结构部分,定义编码技术和标记域的数量。

·字段,定义图片编码块(行、对象、单元和块)以及它们的特征(压缩技术、分辨率和校准)。

·数据字段,定义前面没有定义的图形对象。

TIFF支持的压缩技术有游程编码、霍夫曼编码、Lempel-Ziv-Welch压缩和JPEG压缩方法。TIFF是一种广泛应用的格式,它还支持不同分辨率的图像编码,如预览格式和高清格式图片。

3.5.1.4BMP

位图格式(Bitmap Format, BMP)是基于RGB色彩的一般图像格式。它也被用于单色和黑白图像的编码。BMP格式定义了2个主要部分:头和数据部分。前者被称为位图信息(BITMAPINFO),定义了图片大小、色彩深度、色彩表以及压缩技术。数据部分含有每一行中的各个点的像素值。色彩深度可取的值有1、4、8和24。色彩深度值为每像素4和8比特的图片压缩方案采用游程编码方法,而色彩表中的其他相关信息值则采用特殊的编码算法。

3.5.2结构化文档

结构化文档是内容管理系统中的又一种重要的媒体类型,它的发展主要由2方面促成:印刷媒体工业和网域。另外,超文本和超媒体也对结构化文档语言和标准的发展有一定的影响。与一般文档格式相比(RTF、MS Word或者PDF),结构化文档的特点是使用标记语言并链接到扩展文本和信息。对于内容管理系统来说这是一项特殊的挑战。

这里主要考虑的标准是SGML、HTML和XML。后者在4.5.2与元数据编码、传输和交换一起介绍,因为它主要应用于这些领域。

同类推荐
  • 你考试,我支招

    你考试,我支招

    世界上最有价值的知识是“关于方法的知识”,掌握了科学的学习方法和考试方法,即拥有了一把开启知识宝库的金钥匙。面对各科考试,你都准备好了吗?考试之前的心理准备与知识掌握,考试中的清晰思维与应对技巧,考试后的良好态度,这是每个学生必须面对的问题。本书将告诉你从容进入考场,并取得满意答卷的正确方法。
  • 麻辣典故(世界典故汇编)

    麻辣典故(世界典故汇编)

    本书讲述成语故事,并把联系得上的现实串起来,让读者记住成语,熟知许多典故的来龙去脉。全书共分古典红颜、古典病人、高人异士、好男人·坏男人、另类视野五部分。
  • 班主任工作指导手册

    班主任工作指导手册

    为了更好地为广大班主任服务,进一步发挥优秀班主任的模范带头作用,带动和促进全国中小学班主任事业的发展,我们在总结、宣传新时期班主任杰出代表的先进经验、探索新时期班主任工作的规律的基础上编写了本书,把提高班主任自身素养作为一条主线贯穿始终。同时,对班主任提高自身素质、提升专业素养作了比较详尽的阐述。
  • 浙籍作家翻译艺术研究

    浙籍作家翻译艺术研究

    本书所关注的主要是出生在浙江、也主要在浙江以及周边江南地区从事翻译活动的文学翻译家及其翻译艺术成就。作者力图将翻译理论思想的阐述与具体翻译实践的探讨结合起来,并将宏观的研究综述与微观的翻译文本分析结合起来,力图遵循相关翻译理论以及比较文学理论中的跨文化研究的方法,对浙江文学翻译的成果作了客观的梳理和研究,对浙籍作家的杰出的翻译艺术以及相应的译学思想进行了深入的探讨。
  • 如何说,青春期男孩才会听 如何听,青春期男孩才会说

    如何说,青春期男孩才会听 如何听,青春期男孩才会说

    从某种意义上来说,教育孩子其实就是一场心理战争。如果你觉得你的男孩不服管教,不懂事,不听话,那么你需要掌握孩子控心术。所谓的“孩子控心术”,并不是要使用心理控制让孩子对父母服服帖帖,乖乖就范,更不是什么邪门歪术,而是要与孩子达成积极的有益的沟通所需要的技巧。很多时候,父母只需要了解男孩的心理,改变一下说话的方式或语气,就会发觉:其实,男孩很听话!
热门推荐
  • 天上人间只为寻你在我身边

    天上人间只为寻你在我身边

    千年之前,她被爱恋他的女子重伤而受轮回之苦,辗转千年,他只为寻回当年的她。历尽千万劫,只为有你伴我身边,风卷云散,不管你在何方,我心跟你走。谁若伤你,屠尽九幽我也要让他魂飞!
  • 飞鸟集·新月集(新课标同步课外阅读)

    飞鸟集·新月集(新课标同步课外阅读)

    《飞鸟集》与《新月集》是文学巨匠泰戈尔最具美感和欣赏性的代表作,也是世界上最杰出的诗集和散文集之一。白太和黑夜、海洋和河流、自由和背叛、哲学和宗教,都在泰戈尔的笔下合二为一。短小的语句阐述了深刻的人生哲理,引领读者在读完后探寻真理和智慧,是他诸多文集中最适合青少年阅读的作品,对陶冶他们的情操和激发他们对文学的热爱有着不可估量的作用。本书为《飞鸟集》与《新月集》的合订本,由我国著名的翻译家郑振铎翻译,附录中收录了泰戈尔生平、泰戈尔访华记及1913年诺贝尔文学奖获奖致辞,具有很高的文学价值和收藏价值。
  • 兼职驱鬼师

    兼职驱鬼师

    现代都市,光怪陆离,古老职业的捉鬼术士隐匿其中。燕向沙是个三天打鱼两天晒网的兼职驱鬼师,靠着从老爹手中讹来的法宝吊儿郎当混迹都市。一次诡异的梦境,带出一段前世今生的恩怨。被困封印中两千年的女鬼殊镜为何找上他?所谓的封印又在何处?两千年前燕家少主死亡的真相到底是什么?
  • 家有火星美男

    家有火星美男

    十八岁生日,安妞妞无意穿越火星,遭遇美男一枚。她带着美男一路私奔来地球,安家种田富天下,谁知道买一赠二,肚子里也多了俩。忠犬、傲娇、腹黑一路相随,且看美男异世行。--情节虚构,请勿模仿
  • 寻雪江湖

    寻雪江湖

    公元859年,唐宣宗治政年间,皇帝为了自身的长生和纵欲,不惜大量服食丹药,致使服丹药中毒,疽发于背,久病于床。此时,大臣们久久见不到皇帝,不免猜测皇帝即将驾崩,新帝即将继位,开始对皇帝立储之事众说纷纭。民间因皇帝病入膏肓无法君临天下,社会矛盾开始日益突出。而在江湖中有两大武林传说,这两大传说并非两个人,而是两座山庄,身居北方的山庄名为寻剑,南方名为飘雪,两大山庄守卫正道,不与世俗纷争,成为江湖两大传说。这场百姓灾祸,两大山庄参与其中。既是一个王朝衰亡的落日,也是一场围绕两大山庄江湖风云的开始……
  • 解放长沙

    解放长沙

    公元一千九百四十八年的夏天,华夏神州万川千水,无不沸沸扬扬。黄河在涨潮,长江在涨潮,珠江在涨潮,黑龙江在涨潮。真个是,潮涨潮落,多少悲欢东流去,涨潮落潮,历代兴亡汇心头。
  • 天启之行

    天启之行

    继寒武纪以来,地球上的生命再次迎来了生命大爆炸式发展的机会!看老鼠进化变异成为怪兽之后的恐怖,看蜥蜴如何成为哥斯拉式的强悍,看属于恐龙时代的翼龙如何翱翔于天空!看人类是否能够再次成为万物的主宰!
  • 朝夕草露总要被亘古阳光蒸发掉的

    朝夕草露总要被亘古阳光蒸发掉的

    时光,犹如浩荡流阔的江河。所谓历史,仅是这江河中的浮沫而已。泛滥其中的,乃是生生世世未曾断流的澎湃情缘。
  • 爱情断尽微微

    爱情断尽微微

    人生萧萧,能有几何?只是一瞥,爱得那么惊心,却又动人。虽是一瞥,却是一生.这是一个虐心的故事。婚礼只是个幌子,永远不要相信最爱的人,也许他(她)只是来复仇的。惟惟一生,断尽情笙。煎熬的是你不爱,我不放。“你说若有来生,你是否会向今生一样,对我这么包容。”“会,不过前提是我先死。”说完便吞下余惟事先准备好的药丸。
  • 穿越之巅:神奇世界任我穿

    穿越之巅:神奇世界任我穿

    风宁晨,废材风家三少爷,他天生背负着废材的称号,殊不知上辈子修了什么缘,在一次全家人去狩猎时,穿越来到未来,经高人教育,带着高人的心愿回到了自己的时代,他的就此逆袭之路开始了……