为什么盖住OPPOR11最后一颗牙齿被肉盖住镜头，另最后一颗牙齿被肉盖住不能用

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>手机 >>为什么盖住OPPOR11最后一颗牙齿被肉盖住镜头，另最后一颗牙齿被肉盖住不能用

为什么盖住OPPOR11最后一颗牙齿被肉盖住镜头，另最后一颗牙齿被肉盖住不能用

来源：蜘蛛抓取(WebSpider) 时间：2018-02-20 18:22 标签：灯太亮用纸张盖住可以

当前位置： >>
H264编码器的DSP实现与优化
代鼍………１…０７０…１……．．擎号……．璺堡！翟塑Ｚ……分娄号……．．婴！曼！！……．密姗－………ｊ盟………而簧它手辩校先訾硕士学位论文题（中、英文）目Ｈ．２６４编码器的ＤＳＰ实现与优化Ｔｒａｎｓｐｌ
ａｎｔａｔｉｏｎａｎｄＯｐｔｉｍｉｚａｔｉｏｎｏｆＨ．２６４Ｅｎｃｏｄｅｒ………………………Ｂ…ａｓｅ…ｄ…ｏｎ．瞵Ｐ……………………．作者姓名…．扬羞芳…．指导教师姓名、职务……赵峦工．熬援…．．。ｆ学科门类工学学科、专业模式识别与智能系统提交论文日期……………………三９．Ｑ土生一．且……………………摘要摘要Ｈ．２６４／ＡＶＣ是ⅡＵ．ＴＶＣＥＧ和ＩＳｏ／ⅢＣＭＰＥＧ联合制定的最新的视频编码国际标准，是目前图像通信研究领域的热点问题之一。Ｈ．２６４的视频编码层（ｖｃＬ）采用了许多新技术使得编码性能大幅度提高。但这是以复杂度的成倍增加为代价的，这就使得Ｈ．２６４在实时的视频编码及传输应用中面临着巨大的挑战．利用高性能数字信号处理器（ＤＳＰ）来实现Ｈ．２６４实时编码器是一种快速有效的方法，有助于Ｈ．２６４视频标准的迅速推广和应用．ＡＤＩＢｌａｃｋｆｉｎ５６１是一款高性能的数字信号处理器，具有６００ＭＨｚ的主频。本文选择其作为硬件平台，探索了在资源有限的ＤＳＰ平台上实现Ｈ．２６４编码器的有效途径。论文选择ＪＭ８５作为参考，阐述了Ｈ．２６４编码器Ｃ算法级优化的整个过程，随后在深入剖析算法的基础上，对影响编码速度的瓶颈部分进行研究，寻找算法的改进途径，在运动估计方面提出了改进方法；在此基础上进行将在ＰＣ机下改进的代码向ＤＳＰ的移植及优化工作，根据所选择的ＤＳＰ芯片的特点，对移植后的程序进行Ｃ语言级和汇编语言级的优化，通过Ｍｅｍｏｒｙ配置、Ｃａｃｈｅ应用和ＤＭＡ等多种方法，完成了Ｈ．２“编码的ＤＳＰ移植关键词：Ｈ．２６４标准复杂度分析ＢｌａｃｋｆｉｎＤＳＰ优化ＡｂｓｔｒａｃｔＡｂｓｔｒａｃｔＨ。２６４／ＡＶＣｉｓｔｈｅｎｅｗｅｓｔｖｉｄｅｏｉｎｔｅｒｎａｔｉｏｎａｌｓｔａｎｄａｒｄｄｅｓｉｇｎｅｄｂｙｂｏｔｈⅡＵ－ＴＶＣＥＧａｎｄＩＳＯ／ＩＥＣｒｅｓｅａｒｃｈｆｉｅｌｄ．ＴｈｅＭＰＥＧ．Ｉｔｂｅｃｏｍｅｓａｌｌｉｍｐｏｒｔａｎｔｃｏｎｔｅｎｔｏｆｉｍａｇｅｃｏｍｍｕｎｉｃａｔｉｏｎｇｒｅａｔｌｙ．ｎｅｗｔｅｃｈｎｏｌｏｇｙｏｆＶＣＬｏｎｉｍｐｍｖｅｄｃｏｄｉｎｇｅｆｆｉｃｉｅｎｃｙＨｏｗｅｖｅｒｔｈｅｉｍｐｒｏｖｅｍｅｎｔｉｓｂａｓｅｄｔｈｅｃｏｓｔｏｆｒａｐｉｄｉｎｃｒｅａｓｅｄｃｏｍｐｌｅｘｉｔｙ，ｗｈｉｃｈｍａｋｅｓｉｔｄｉｆｆｉｃｕｌｔｙｏｆｒｅａｌ―ｔｉｍｅｃｏｄｉｎｇａｎｄｔｒａｎｓｍｉｓｓｉｏｎｏｆＨ．２６４．ＢａｓｅｄＥｎｃｏｄａｒｉｓｏｎｈｉＤ－ｐｅｒｆｏｒｍａｎｃｅｏｆｍｏｓｔＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒｔｏｉｍｐｌｅｍｅｎｔＭｅｄｉａＨ．２６４ｖｉｄｅｏｏｎｅｅｆｆｉｄｅｎｔｍｅｔｈｏｄｓ，ｗｈｉｃｈａｌｓｏｈｅｌｐｔｏｐｒｏｍｏｔｅｔｈｅａａｐｐｌｉｃａｔｉｏｎｏｆＨ．２６４．ＡＤＩＢｌａｃｋｆｉｎ５６１ｉｓｈｉｇｈ－ｐｅｒｆｏｒｍａｎｃｅＤｉｇｉｔａｌＰｒｏｃｅｓｓｏｒｗｉｔｈ６００ＭＨｚｃｌｏｃｋｒａｔｅ．ＴｈｉｓｄｉｓｓｅｒｔａｔｉｏｎｃｈｏｏｓｅＢＦ５６１ａｓｔｈｅｈａｒｄｗａｒｅｐｌａｔｆｏｒｍｔｏｉｍｐｌｅｍｅｎｔｓｔｈｅｒｅａｌ―ｔｉｍｅＨ．２６４ｅｎｃｏｄｅｒ，ａｎｄｅｘｐｌｏｉｔｅｄｔｈｅｅｆｆｉｃｉｅｎｔｍｅａｎｓｏｆＨ．２６４ｅｎｃｏｄｅｒｉｍｐｌｅｍｅｎｔａｔｉｏｎＴｏｓｕｃｃｅｓｓｆｕｌｌｙｂａｓｅｄｏｎＤＳＰｐｌａｔｆｏｒｍ．ｃｏｄｅｏｎｔｏｔｈｅＤＳＰｄｅｖｉｃｅ．ａｆｔｅｒｉｎｔｒｏｄｕｃｅｓｔｈｅｔｒａｎｓｐｏｒｔＨ．２６４ＣｐｅｒｆｏｒｍａｎｃｅｏｆｓｔａｔｅｓｔｈｅＢＦ５６１ＤＳＰａｎｄｕｎｉｑｕｅｆｅａｔｕｒｅｓｏｆｉｔｓａｒｃｈｉｔｅｃｔｕ聘，ｔｈｉｓｄｉｓｓｅｒｔａｔｉｏｎｗｈｏｌｅｏｐｔｉｍｉｚｉｎｇｐｒｏｃｅｓｓｏｆｔｈｅｏｒｉｇｉｎａｌＣｃｏｄｅ．ＩｔｃｈｏｏｓｅＪＭ８５．Ｖａｒｉｏｕｓｔｏｍｅｔｈｏｄｓａｒｅａｄｏｐｔｅｄａｄｊｕｓｔｉｎｇｔｈｅｏｖｅｒａｌｌｐｒｏｇｒａｍｓｔｒｕｃｔｕｒｅａｎｄｄａｔａｓｔｒｕｃｔｕｒｅ．ＴｈｅｔｈｅｎｅｗａｌｇｏｒｉｔｈｍｉｓｃｏｎｓｉｓｔｅｎｔｗｉｔｈｔｈｅＢａｓｅｌｉｎｅＰｒｏｆｉｌｅ，ｓｉｍｐｌｅ，ｃｌｅａｒ，ｗｉｔｈｏｕｔｒｅｄｕｎｄａｎｔａｎｄｈａｓｔｈｅｓａｍｅｃｏｄｉｎｇｒｅｓｕｌｔｏｆｔｈｅｏｒｉ舀ｈａｌＪＭ．Ｔｈｒｏｕｇｈｄｅｅｐｌｙｓｔｕｄｙｉｎｇｔｈｅｍａｉｎｔｅｃｈｎｉｑｕｅｓａｎｄａｌｇｏｒｉｔｈｍｓ，ｆｉｎｄｏｕｔｔｈｅｂｏｔｔｌｅｎｅｃｋｗｈｉｃｈｉｎｆｌｕｅｎｃｅｓｔｈｅｃｏｄｉｎｇｓｐｅｅｄ，ｔｈｅｎｔｈｅｃｏｄｅａｎｉｍｐｒｏｖｅｄｄｉａｍｏｎｄ―ｓｅａｒｃｈｉｎｇａｌｇｏｒｉｔｈｍｉｓｐｒｏｐｏｓｅｄｔｏｉｍｐｒｏｖｅｉｍｐｒｏｖｅｄｅｎｃｏｄｉｎｇａｌｇｏｒｉｔｈｍｓａｒｅａｓｅｆｆｉｃｉｅｎｃｙ．ＦｉｎａｌｌｙｔｈｅｕａｎｓｐｌａｎｔｅｄｔｏｔｈｅＤＳＰｃｈｉｐ，ｓｏｍｅｋｅｙｐｏｉｎｔｓ，ｓｕｃｈｄｅｃｉｓｉｏｎｏｆｅｎｃｏｄｅｒｔｏｏｌｓ，ｍｅｍｏｒｙｃｏｎｆｉｇｕｒａｔｉｏｎ，ｃａｃｈｅ，ＤＭＡ，Ｃａｎｄａｓｓｅｍｂｌｙｌａｎｇｕａｇｅｏｐｔｉｍｉｚａｔｉｏｎ，ａｌｅｓｕｍｍａｒｉｚｅｄ．Ｋｅｙｗｏｒｄ：Ｈ．２６４／ＡＶＣｃｏｍｐｌｅｘｉｔｙａｎａｌｙｓｉｓＢｌａｃｋｆｉｎＤＳＰｏｐｔｉｍｉｚａｔｉｏｎ创新性声明本人声明所呈交的论文是我个人在导师的指导下进行的研究工作及所取得的研究成果。尽我所知，除了文中特别加以标注和致谢中所罗列的内容以外，论文中不包含其它人已发表或撰写过的研究成果；也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志所做的任何贡献均已在论文中做了明确的说明并表示了谢意。本人签名：日期：关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定，即：研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后，发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件，允许查阅和借阅论文；学校可以公布论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存论文。（保密的论文在解密后遵守此规定）本学位论文属于保密，在一年解密后适用本授权书。本人签名：导师签名：Ｒ期日期坦２：！：塑：第一章绪论第一章绪论１．１引言自上世纪７０年代以来，计算机与数字信号处理技术有了突飞猛进的跨越式发展，互联网逐步普及，网络服务水平也随之提高，这一切使得简单的文本信息无法满足信息时代的通信要求，人类对信息的处理迅速地由模拟领域进入了数字领域，处理的对象集中于多媒体信息。因此２ｌ世纪被形象地称为数字时代或多媒体时代。多媒体信息主要包括文字、声音、图像和视频等内容，视频是其中最重要的组成部分。且前，可视电话，视频会议，安全监控，远程教育和视频点播等多媒体服务已成为人们关心的热点。这是因为：首先视频信息具有直观、形象、准确、高效和应用广泛等特点，因此极易被人类接受。据统计人类接受的信息７０％来自视觉；其次，视频信息具有无与伦比的信息容量，在许多工程领域，都会遇到对海量图像数据进行传输与存储的问题。在传输方面，包括数字电视，遥感照片，军事侦察图像，可视电话，视频会议等；在存储方面：教育、商业、管理等领域的图文资料，ＣＴ机，核磁等设备的医用图像，天气云图等，几乎涉及各个行业。但是，与文字、数据等相比，数字化后的视频信息，海量的数据量给信息的传输核存储造成极大的困难，成为阻碍人类有效获取和使用信息的瓶颈之一。原始的数字视频几乎没有任何实用价值。例如，对于ＳＩＦ（ＳｏｕｒｃｅＩｎｐｕｔＦｏｒｍａｔ）格式，ＮＴＳＣ制式，４：４：４采样的数字电视图像，每帧数据量为３５２×２４０×３＝２５３ＫＢ，每秒数据量为２５３×３０＝７．６０３ＭＢ／ｓ，一片ＣＤ．ＲＯＭ可存帧数６５０／０．２５３＝１．２２６髓帧，一部ＣＤ．ＲＯＭ节目时间仅为（６５０／７．６０３）／６０＝１．４２分；对于高清晰度数字电视（Ⅱ＇Ｕ―Ｒ７０９），每秒数据量高达８８４．７Ｍｂｉ协，而地面广播系统的传输带宽仅有６Ｍ到８Ｍ。因此数字视频必须经过压缩才能有实际意义。为了在有限的容量里存储更多的图片，或为了在最短的时间里传递更多的信息，或在有限的带宽条件下传输更多的活动图像，必须研究如何最大限度地压缩图像，并保证重建图像能够被用户接受，这样视频压缩技术就成为多媒体技术的关键所在。１．２视频编码原理视频编码的目的是实现对视频的压缩，其核心内容是去相关，即通过减少视频序列间的相关性，用较少的比特数来表示视频内容，降低冗余，从而实现对视频的压缩。视频序列中的冗余主要有以２Ｈ．２６４编码器的ＤＳＰ实现与优化下几个方面ｆ”】：１．空间冗余：在同一帧画面中，相邻的象素间存在的相关性。特别是当这些相邻象素位于同一个视频对象中时，相关性极强，例如图像的背景区域；２．时间冗余：通常对视频序列而言，除非发生场景切换，否则相继帧在时间上都是连续的。即在前后两帧中往往包含与当前帧相同的背景和对象，只是由于镜头的转动或对象的移动使得空间位置发生变化。运动越缓慢，位置的变换越小。因此视频序列存在极强的相关性；３．编码冗余：对于编码符号，其平均码长高于所表示的信息熵，这个偏差就形成了编码冗余；４．人眼视觉冗余：由于人眼视觉的非均匀性，使得人眼视觉对某些空间频率感觉迟钝。因此视频中不同频率成分的内容对于人眼系统而言其重要性不同，也就是说存在频域冗余。例如人眼视觉系统对亮度信号变化的敏感性高于色度信号变化，因此可以对色度分量进行降采样，同时保持主观视觉质量不变．ＹＵＶ４：２：０色差格式就是对色度分量在水平和垂直两个方向进行２：１的降采样。另一方面对信号频域的各个分量可以采取不同的量化步距，将人眼感觉不敏感的分量去除，而不会引起主观质量的下降；５．结构冗余和知识冗余：图像的某些区域存在非常强的纹理结构，图像象素值有明显的分布模式，形成结构冗余。或者图像中包含的信息与某些先验知识有关，例如人的五官位置对于人脸而言就是一种先验知识，这种冗余构成知识冗余。在上述冗余中，编码冗余、空间冗余和时间冗余都依赖于图像数据的统计特性，可以统称为统计冗余。信源编码的方法按照压缩数据能否被准确恢复分为两大类：无损编码和有损编码。虽然无损编码可以无失真地恢复原始数据，但其压缩效率十分有限（１０倍以下），因此视频压缩中是将无损编码和有损编码结合使用．视频编码中主要压缩技术有以下几种：ｌ、预测编码不是对一个象素直接编码，而是用同一帧（帧内预测编码）或相邻帧（帧问预测编码）中的象素值来进行预测，然后对预测残差进行量化和编码。显然预测编码实际是利用了图像数据中的空间和时问冗余。线性预测编码又称为差分脉冲编码调制ＤＰＣＭ（ＤｉｆｆｅｒｅｎｔｉａｌＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ），由于算法简单，易于硬件实现，已被各种视频编码标准采纳．帧间预测编码的主要方法有帧重复法、帧内插法和运动补偿法等。其中运动补偿法在视频编码中应用得最为广泛．运动补偿预测通常可以采用单向预测（一个参考帧），双向预测（两个参考帧）和插值预测（取两个参考帧预测值的平均）第一章绪论３来实现。由于运动补偿预测可以有效地减少视频序列的时域冗余，因此成为构成当前主要视频编码标准最基本的技术之一。２、变换编码变换编码是构成当前主要视频编码标准的另一项最基本技术，用来消除图像的频域（变换域）冗余【”。变换编码可分为正交变换编码，子带编码【“州和小波编码［１１－１２１．正交变换编码通常是将空域相关的象素点映射到另一个正交矢量空间，使得变换后的系数之间相关性降低。常见的正交变换有Ｋ－Ｌ（Ｋａｒｈｕｎｅｎ．Ｌｏｃｖｅ）变换、离散傅立叶变换ＤＦＴ（ＤｉｓｃｒｅｔｃＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）、离散余弦变换ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、沃尔什哈达玛ｊ（Ｗａｌｓｈ－Ｈａｄａｍａｒｄ）变换和哈尔（Ｈａｒ０变换。Ｋ－Ｌ变换是均方误差准则下的最优变换，但实现困难。在现行视频编码标准中几乎都采用了性能最接近Ｋ－Ｌ变换的ＤＣＴ。实际上当自相关系数为１时，Ｋ－Ｌ变换就退化为ＤＣＴ变换【射。Ｄｃｒ变换是１９７４年Ａｈｍｅｄ【６１提出的，它具有一组固定的基函数（和图像内容无关），以及很好的能量压缩和去相关特性。ＤＣＴ变换和ＤＦｒ变换密切相关，ＮＸＮＤＣＴ可以由它的偶对称扩展２ＮＸ２ＮＤＦＴ变换表达出来，这样利用ＤＦＴ变换的可分级特性以及若干ＦＦＴ变换算法中的一个。可以用Ｏ（２Ｎ２ｌｏｇ，Ⅳ）操作代替０（Ⅳ４）计算出ＮＸＮＤＣＴｔ”。除此之外，目前已经有了许多更为实用的ＤＣＴ变换快速算法１７．４１。由于Ｄｃｒ变换采用实数计算，加上有效的快速算法实现，使得硬件实现成为可能，因此被广泛地采用。通过正交变换编码，图像的能量集中在低频区域，表示图像中缓慢变化的内容，而图像的边缘、细微的纹理等细节部分集中在变换的高频区。在压缩过程中，通常采用同一个量化器进行量化，牺牲了图像的细节部分，造成解码图像模糊。在高压缩比时，基于块的正交变换编码还会产生块效应（Ｕｏｃｋｅｆｆｅｃｔ）和振铃效应∞ｎｇｅｆｆｅｃｔ），进～步降低图像质量。因此出现了子带编码和小波编码等新方法。子带编码是将图像分裂成几个不同频带的子带（Ｓｕｂ－ｂａｎｄ），对不同的予带设计不同的编码参数，提高图像质量。小波变换编码充分地利用了小波分析在时域和频域同时具有良好的局部化特性，与人眼视觉特性相符的多分辨率能力，分析系数分布平稳，自然分级的金字塔式数据结构等优点，在视频压缩领域引起广泛的关注。它利用与正交分解完全不同的小波分解，以原始图像（而非原始图像中的块）为初值，不断地将上一级图像分解为４个子带：上一级图像中的低频信息、垂直方向、水平方向和对角线方向的边缘信息。从多分辨率分析出发，一般每次只对上一级的低频子图图像进行分解。将整个图像而非其中的块作为整体进行传送，因此不会产生块效应。由于小波变换的金字塔式数据结构的每一层都包含整个图像的信息，只是其中的分辨率不同，因此可以选择传送部分或全部，非常简单，自然的实现可分级视频编码。４Ｈ．２６４编码器的ＤＳＰ实现与优化３、统计编码根据香农信息论的观点，信源冗余度来自信源本身的相关性和信源内部事件概率分布的不均匀性。统计编码主要有基于概率分布特性的霍夫曼编码和算术编码，以及基于相关性的游程长度编码三类。霍夫曼编码（Ｈｕｆｆｍａｎｃｏｄｉｎｇ）是一种变长编码ＶＬＣ（ＶａｒｉａｂｌｃＬｅｎｇｔｈＣｏＯｉｎｇ）。它将信源符号按概率大小重新排序。通过二叉树算法，依次将两个概率最小的结点合并，直至根结点。完成树的构造后，给所有的树枝分配０和ｌ，这样就可以给高概率符号分配短码，而概率小的符号则分配较长的码字，去除符号间的统计冗余。在已知信源符号概率时，可以给出极好的编码性能。但霍夫曼编码严重依赖信源的统计特性，编码前必须有信源概率分布的先验知识。对于复杂的视频来说，只能用对大量数据统计后获得的近似分布来代替，因此实际应用时无法达到最佳性能。另一方面ＶＬＣ提高了编码效率，但不利于硬件实现。算术编码１１１州（Ａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）是２０世纪８０年代发展起来的，理论上，算术编码和霍夫曼编码都是最佳的，但在信源概率分布未知的情况下，算术编码优于霍夫曼编码。算术编码的基本原理是利用【０ａ］之问的一个概率区间来表示数据序列。将信源ｘ的一个给定状态Ｘ―ｆ蜀，Ｘ：，．．ｚ．ｖ’与【叩】问的一个由大概率Ｐ和小概率Ｑ限定的概率子区间相联系，区间的长度等于序列的概率ｐＧ）。编码器从Ｎ－１开始，逐位地处理输入的符号流。每输入一位，更新当前符号的条件概率，并以此调整尸和Ｑ限定的概率子区问。随着Ⅳ的增加，和输入符号序列相联系的概率子区间就会变得越来越小。最后用这个表示概率子区间的小数给符号序列编码。游程长度编码ＲＬＣ（Ｒｕｎ－ＬｅｎｇｔｈＣｏＯｉｎｇ）是将符号值相同的连续符号串用一个游程长度（符号数）和一个代表值（值）描述。这样可以用更紧密的序列代替原有的相同值符号串。在视频压缩中，量化后的数据常常出现大量的连零系数，利用游程长度编码可以有效地降低表示零码的比特数。４、分形编码和模型基编码本文的关注焦点主要集中于基于块匹配的编码框架中，因此分形编码ｆ１５－１７］和模型基编码［１８－１９ｌ超出了本文的讨论范围，不再一一详述。其具体的编码原理可以参见相关的文献。１．３视频编码标准视频编码技术的标准化给不同的厂商和视频提供者奠定了一个共同工作的基础，也为编码视频的交互和更为广泛的应用创造了必要的条件。开发一种国际标准需要来自不同国家的许多同行的合作，并需要一个能支持标准化过程和实篪标第一章绪论５准的组织㈣。视频编码国际标准的制定主要由ＩＴＵ－Ｔ０ｎｔｅｍａｔｉｏｎａｌＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＵｎｉｏｎ－ＴｃｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｔａｎｄａｒｄｉｚａｔｉｏｎＳｅｃｔ００和ＩＳＯ／ＩＥＣ（ＩｎｔｅｍａｔｉｏｎａｌＯｒｇａｎｉｚａｔｉｏｎｆｏｒＳｔａｎｄａｒｄｉｚａｔｉｏｎ／ＩｎｔｅｒｎａｔｉｏｎａｌＥｌｅｃｔｒｏｔｅｃｈｎｉｃａｌＣｏｍｍｉｓｓｉｏｎ）负责。ｒｒＵ．Ｔ相继发布了Ｈ．２６ｘ系列标准，而ＩＳＯ／ＩＥＣ则推出了ＭＰＥＧ系列标准。这些标准都是建立在基于块匹配的混合编码框架下的，若且有非常类似的结构．下面对基于块匹配混合编码框架的基本结构、必要算法和相关视频编码标准作一个简要介绍。１．３．１混合编码框架下的视频编码器到目前为止，不管是ＭＰＥＧ系列标准还是ⅡＵ－Ｔ的Ｈ．２６ｘ系列标准，其编码基本原理都是一样的，那就是用时域预测去掉时域冗余，空域预测去掉空间冗余，然后ＤＣＴ域量化，去掉高频不重要的信息，再用ＶＬＣ和游程编码使得编码可以用最少的比特来表示码流。所不同的是，各种标准采用的码表有所差别，以面向不同的应用；另外，新的标准在某些模块会采用一些新的算法，做出改进。现有的视频编码标准都是ＤＰＣＭ／Ｔ的压缩方式，不同标准下的编解码器有所差别，但大致的结构基本是一致的。基于块匹配混合编码框架下的视频编码系统是将编码帧划分为Ｎ×Ｎ的块，每一个块相对独立地进行处理。其核心思想是利用帧间预测编码消除图像序列中的时域冗余，利用变换编码消除频域冗余。其编码器框图如图１－１。这些编码器都用到了运动估计和运动补偿、Ｄｃｒ变换等技术。图１－１基于块匹配混合编码系统编码器示意图通常编码器的主要模块为运动估计（ＭｏｔｉｏｎＥｓｔｉｍａｔｉｏｎ）和运动补偿ｆＭｏｔｉｏｎＣｏｍｐｅｎｓａｔｉｏｎ）以及纹理编码。其中运动补偿用到了反量化（ＩｎｖｅｒｓｅＱ）、反变换（Ｉｎｖｅｒｓｅｏｃｔ），纹理编码用到了变换（ＤＣＴ）量化（Ｑ）、变长编码（ＶａｒｉａｂｌｅＣｏｄｉｎｇ）等技术。Ｌｅｎｇｔｈ６Ｈ．２６４编码器的ＤｓＰ实现与优化１．３．１．１运动估计和运动补偿常用的运动估计算法有象素递归，块匹配等。考虑到规律性和软硬件实现的简单性，块匹配技术是通常采用的更合适的方法。目前所有压缩编码标准的运动估计都采用块匹配技术。由于运动估计运算的复杂性，它也是编码过程的最大的运算瓶颈。全搜索算法的结果最好，但要以很大的计算复杂性为代价，所以在实现中，必须对运动矢量的质量与运动估计过程的计算复杂性折衷考虑．参考鞭Ｅ咄 ’裔钕Ｃ田攮寰譬【Ｊ口■捌燃点囵甄魁块焉．。刚。趣靖矢量图１－２运动估计原理图１－２就显示了块匹配运动估计原理【矗】。当一个物体通过时，它可能在每幅画面上出现在不同的位置，但其本身的外形并没有多大的改变。通过在编码器上测量运动可以降低画面差异。画面差异被以矢量的方式送往解码器．解码器使用该矢量将上一幅画面的一部分移至新画面中更恰当的位置上。在下列情况下，运动估值的压缩效率较好：?一个视频对象的大部分特征，如形状和方位，在各帧之间保持不变。●只有帧内视频对象的位置改变。运动估计过程计算每ＮＸＮ象素区域（称为宏块）的运动矢量，运动矢量就是宏块从一帧到另一帧的相对位移。假设在当前帧（ｔ时刻）中某一宏块左上角的位置是Ｏ，Ｙ），如果该宏块在参考帧中的最佳匹配宏块位于Ｏ＋Ⅳ，Ｙ＋ｖ），那么位于０，ｙ）处的宏块的运动矢量就是Ｏ＋Ⅳ，Ｙ＋ｖ）．在相对坐标系中，运动矢量表示为＠，ｙ）。如果参考帧是ｔ时刻之前的（ｆ一厅）时刻，则运动矢量称为前向运动矢量。如果参考帧是ｔ时刻之后的（ｆ＋押）时刻，则运动矢量称为后向运动矢量。考虑到通过帧间运动补偿可以有效压缩数据比特数，数据压缩标准中通常采用三种类型的图像：帧内图（Ｉ图像），预测图（Ｐ图像）和双向预测图（Ｂ图像）。 ●帧内图像（１帧）：编码时不需要其它参考帧。帧内编码宏块不需要运动矢量。ｌ帧画面是指帧内编码画面，解码时不需要其它额外的信息。ｌ帧主要由变换系数组成，不含矢量。它允许观众变换频道，并防止误码的传递。 ●预测图像（Ｐ帧）：Ｐ帧数据由在前面画面中描述的每个宏块的矢量所组第一章绪论７成，而不是由描述必须加到宏块上的校正或差异数据的变换系数所组成。Ｐ帧需要的数据大约是Ｉ帧的一半。在同一个Ｐ帧内，某一宏块可以编码为Ｐ类型（前向预测编码）或ｌ类型（帧内编码）宏块。如果在运动估值过程中计算出的运动矢量不能用时，则该宏块选择Ｉ类型编码模式． ●双向预测图像（Ｂ帧）：同时用前面和后面的Ｉ帧或Ｐ帧作参考帧进行运动补偿预测编码。在同一个Ｂ帧内，某一宏块可以编码为Ｉ类型，Ｐ类型或Ｂ类型编码模式．Ｂ帧通常每个宏块需要两个运动矢量：一个前向运动矢量和一个后向运动矢量的线性插值。由于双向预测非常有效，所以Ｂ帧需要的数据大约是ｌ帧的四分之一．这些图像类型的组织结构十分灵活，可以由编码器的参数决定。在同一个视频帧中，每个宏块也可以采用不同的编码类型。每个宏块具有的运动矢量数目取决于宏块的编码类型。各种块匹配算法在以下三方面有区别：块大小选择，最佳匹配标准，搜索策略。在Ｈ．２６４标准中，可以选择从１６Ｘ１６到４Ｘ４等多种变化的尺寸为块匹配尺寸．最佳匹配可以用多种方法来判断。最常用的实现简单的方法是绝对差之和（ＳＡＤ）方法，也就是说，最佳匹配宏块是使ＳＡＤ（／，，）取最小值的宏块。ＳＡＯ（ｆ，，）定义如下：Ⅳ一１Ⅳ一１ＳａＤｑ，，）。磊荟Ｉｃ（ｘ＋七，），＋７）一Ｒ（ｘ＋‘＋七，），＋，＋‘）ｃ０＋ｔ，Ｙ＋ｆ）表示当前帧中位于Ｏ，Ｙ）处宏块的象素，该宏块被称为估计宏块。ＲＯ＋“七，Ｙ＋，＋ｆ）表示参考帧中宏块的象素，该宏块被称为参考宏块。ｆ，，定义在搜索区域内：一Ｐ‘ｆ‘Ｐ，一Ｐｓ，‘Ｐ．３１，Ｍ表示宏块的尺寸。位于Ｏ，），）处的宏块的运动矢量是使函数ＳＡＯ（ｉ，，）取最小值的Ｏ，，）。当最佳匹配宏块与估计宏块几乎相同时，差值副ＤＯ，，）非常小．实际上，只有对ＳＡＤ（ｉ，，）值小于某一预定阈值的宏块，才能使用运动估值算法。运动估计的过程通常是：首先对宏块的亮度块用全搜索方法得到整象素精度的运动向量，然后用这个运动向量作为初始估计，在它周围进行半象素精度的搜索。将得到的亮度块的运动向量除以２作为对应的宏块的色度块的运动向量。对于作参考的帧，由于它需要能够独立解码，因此在解码的时候可能没有帧外部的象素值，而在运动估计时，可能要用到这些象素值，因此需要先采用“重复填充” 技术来根据帧内部的象素值来外插帧外部的象素值。填充过程可看作是根据帧内部的象素点对帧外部的象素点进行预测。因此作运动估计之前，要先对参考帧进８Ｈ．２６４编码器的ＤＳＰ实现与优化行填充，然后进行运动估计．运动补偿是指根据运动矢量在参考帧中找出参考块。如果运动矢量的工分量和ｙ分量都是整象素长度，则直接在参考帧中找出参考块：如果是半象素长度，则需要通过内插运算计算出参考块，计算出的参考块需要加上解码得出的误差块才能得到当前块。运动补偿是减少帧序列冗余的有效方法。１３．１．２ＤＣＴ变换编码ＤＣＴ变换编码方法归纳起来可分为：离散余弦变换、对ＤＣＴ变换系数进行量化（包括量化、ｚ字扫描、行程编码）和熵编码三个阶段．为得到更高压缩比，必须对Ｄｃｒ系数进行量化。为了进一步提高ＤＣＴ固有的压缩性和减小运动信息对整个码率的影响，要使用可变长度的码字进行编码（即变长码ＶＬＣ）。视频编码算法中帧内和帧闻编码的核心算法都是ＤＣＴ变换编码，视频压缩算法中采用的８×８二维ＤＣＴ定义如下：ｓ（≈），）－耄耄ｃｏ）ｃｏ），ｍ，ｖ）ｃｏｓ垡气詈坦ｃｏｓ垦之专崆盹Ｖｍ㈨，砉私ｃｏｓ学ｃｏｓ％竽其中ｚ。是在ｆｆ，刀位置处的象素值，“和ｖ分别是水平和垂直频率索引，而常量ｃ０）和ｃ∽由下式给出：∽。岛的ＤＣＴ变换。如下所示：ｋ＿０’Ｏｔｈｅｒｗ／ｓｅ上式的运算，对８×８块中的每个象素有“次乘法和６３次加法，对整个块中的６４个象素值共有４０９６次乘法和４０３２次加法。等效于先对ｖ分量求和，再对Ｈ分量求和，相当于先对块中的每一列进行一维ＤＣＴ运算，然后再对其结果的每一行进行一维ＤＣＴ运算。这就是基本的行列分离法，把二维的ＤＣＴ变换化成一维盹力－掣警酬警“石黔ｃｏｓ【譬铲Ｖ刁阻ｃ＠）．ｊｋ＿ｏ．１ｏｔｈｅｒｗｉｓｅ【万图１－３是每一个单独ＤＣＴ系数逆向变换后的结果。第一章绪论９图１－３８×８尺寸ＤＣｒ变换在亮度信号中，左上方的系数是整块的平均亮度或ＤＣ分量。在顶行上移动时（向右），水平空间频率会增加。在左列上移动时（向下），垂直空间频率会增加．在实际画面中，不同的垂直和水平空间频率会同时出现，块中一些点的系数将代表所有可能的水平频率和垂直频率的组合。对彩色画面而言，ｙ、ｃ，和Ｃ。数据被组合成分离的８×８排列，并各自独立变换。在相当真实的节目内容中，许多系数都是零值或接近零值，所以不会被传送。这就产生了实际无损耗的压缩。如果需要更高的压缩系数，那么非零系数的字长必须缩短，这样会导致这些系数精度下降，并将在处理中产生损耗。１．３．２主要视频编码标准图１．４视频压缩编码国际标准的发展各种视频压缩编码标准都是根据人们在不同领域中对声像数据的要求所制定的。并且随着人们的需求不断地发展。视频压缩编码标准按其制定的时间大概可以用图１－４进行描述。１、Ｈ．２６１ｔ３１ｌ１０Ｈ．２６４编码器的ＤＳＰ实现与优化Ｈ．２６１是第一个获得广泛应用的视频编码标准。它的全称为。ＶｉｄｅｏａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓａｔｃｏｄｅｃｆｏｒＰ×６４ｋｂｉ帕”。目标是在ＩＳＤＮ（ＩｎｔｅｇｒａｔｅｄＳｅｒｖｉｃｅｓＤｉ【ｇｉｔａｌＮｅｔｗｏｒｋ）上以ＰＸ６４Ｋｂｐｓ，Ｐ－Ｌ２，．．．３０的速率开展视频会议和视频电话业务。Ｈ．２６１定义了一个完整的视频编码算法，采用了帧内图像编码、帧间误差预测、运动补偿、ＤＣＴ、交长编码等技术，建立了取得巨大成功的基于块混合编码框架，为后来的ＭＰＥＧ．１、ＭＰＥＧ．２等视频压缩标准提供了基础。２、ＭＰＥＧ．１Ｉ矧１９９１年１１月活动图像专家组（ＭＰＥＧ）制定了ＭＰＥＧ．１标准。ＭＰＥＧ标准在Ｈ．２６１视频编码算法的基础上改进、发展。ＭＰＥＧ．１改进的主要内容是增加了Ｂ图像帧（双向预测）和图像组（ＧＯＰ），这些改进具有更高的压缩比，同时定义了编码算法中各工具层的语法，使视频的可操作性更灵活。ＭＰＥＧ－１标准是将数字视频信号和与之相伴的音频信号在一个可以接受的质量下，能被压缩到码率约１．ＳＭｂｉｔ／ｓ的一个ＭＰＥＧ单一流，主要应用于存储应用。ＭＰＥＧ．１标准只规定了码流语法和解码过程，用户可以很好地利用这个语法的灵活性来设计非常高质量的编码器和非常低成本的解码器。编码器的设计中一些重要参数，如运动估值、自适应量化和码流速率控制等可以由用户自由确定。速率约为１．２Ｍｂ／ｓ的用ＭＰＥＧ．１算法压缩的视频图像的质量相当于ＶＨＳ（家用视频系统）记录质量。空间分辨率限制为每视频帧扫描行３６０个象素，并且在源编码器端的视频信号为３０帧／秒，非隔行扫描。对大多数原始图像内容，可得到无人工痕迹的图像质量。ＭＰＥＧ．１标准是ＶＣＤ工业标准的核心，现在已经走入千家万户；利用ＭＰＥＧ．１音频的三层ＭＰ３音乐格式也倍受青睐．３、ＭＰＥＧ．２１”ＩＩＳＯ／ＩＥＣ于１９９１年开始研究新的标准。新标准着力于提高视频质量，提供不亚予ｂＩＴＳＣ／ＰＡＬ直到１０Ｍｂｐｓ左右的ＣＣＩＲ６０１质量。１９９４年公布了ＩＳＯ／ＩＥＣｌ３８１８（ＭＰＥＧ．２）草案，一年后成为国际标准。因此，ＭＰＥＧ－２标准能广泛应用于卫星广播业务（ＢＢＳ）、电缆电视（ＣＡＴＶ）、数字电视地面广播（啪）、通信等众多领域。ＭＰＥＧ．２是工业标准Ｄ、ｌ，Ｄ的核心标准。作了重要的改进和扩充，针对隔行扫描的常规电视图像专门设置了“按帧编码”点播电视（ＶＯＤ）、数字声音广播（ＤＡＢ）、多媒体终端、网络数据库业务、双工ＭＰＥＧ－２是ＭＰＥｏ．１的一个超集，它后向兼容ＭＰＥＧ．１。ＭＰＥＧ．２又对ＭＰＥＧ－１和“按场编码”两种模式，并对运动补偿作了相应的扩充，使其编码效率显著提高。档次和等级的划分是ＭＰＥＧ－２为适应不同应用而定义各个子集的结果。“档次”是集成后的完整码流的一个子集，而每个“档次”的“等级”则是对编码参数所做出的进一步限制。“档次／等级”是通过确定码流中相应的标题信息及附加第一章绪论信息中的有关参数来给定的，这样，为较高“档次”和“等级”码流设计的解码器能够对相同或较低档次的数据解码。４、Ｈ．２６３１卅针对甚低码率（低于６４ｋｂｐｓ）的视频会议和可视电话的应用，在１９９５年１１月，兀Ｕ－Ｔ推荐的低码率视频编码标准Ｈ．２６３建议草案出台。Ｈ．２６３标准的视频编码算法与Ｈ．２６１相似（运动补偿和ＤＣＴ算法），但它在性能上有了显著提高。试验表明：在相同的主观质量下，Ｈ．２６３编码码率仅为Ｈ．２６１的一半。与Ｈ．２６１相比，Ｈ．２６３的主要区别如下：Ｈ．２６３支持更多的图像格式、半象素精度运动估计、宏块（１６Ｘ１６）运动估计和块（８×８）运动估计的自适应变换、３．Ｄ（ＩＡｓＴ－ＲＵＮ．ｕ’ⅦＬ）而不是２．Ｄ（ＲＵＮ．ｕⅣＥＬ）游程编码、可选的无限制运动矢量、可选的算式编码、可选的重叠运动补偿和四运动矢量／宏块的高级预测模式和可选的双向预测。在完成Ｈ．２６３标准的制定工作后，为适应在现有的窄带网络环境上传输视频信息，１ＴＵ．Ｔ在１９９８年１月通过了Ｈ．２６３标准的第二版Ｈ．２６３＋，增加了十二个新的高级模式。２０００年１１月，又推出了第三版Ｈ．２６３＋＋，新增３个高级模式。新增模式主要包括：参考帧再采样模式、高级帧内编码模式、交替帧间ＶＩＪ（３选择模式、分片结构模式、参考帧选择模式、数据分割模式、可分级扩展编码等。５、ＭＰＥＧ．４１３８一ａｇｌ在成功制定了ＭＰＥＧ．１和ＭＰＥＧ－２后，国际运动图像编码专家组（ＭＰＥＧ）于１９９９年初正式推出了令人称道的ＭＰＥＧ．４标准。与前两者不同，ＭＰＥＧ４不仅仅是针对一定比特率的视频、音频编码，还更加注重多媒体系统的交互性和灵活性。因此，ＭＰＥＧ．４采用了全新的第二代视频压缩技术，引入视听对象（Ａｕｄｉｏ／Ｖｉｓｕａｌ０ｂｊｅｃｔｓ，ＡＶＯ）的概念，使得更多的交互操作成为可能。以上这些优点无疑使得ＭＰＥＧ－４具有广阔的应用前景，如Ｉｎｔｅｍｅｔ／Ｉｎｔｒａｎｅｔ上的多媒体流服务、视频点播、可视游戏、低码率的移动多媒体通信如视频手机等交互式多媒体应用、数字电视与演播电视、虚拟会议等等。６、Ｈ．２６４１”１１９９８年１月，ＩＴｕ．Ｔ的ＶＣＥＧ专家组提出了Ｈ．２６Ｌ建议，开始广泛征求意见；１９９９年，ＶＣＥＧ专家组给出了Ｈ．２６Ｌ的第一个测试模型ＴＭＬ－１，公开进行测试和改进；２０００年６月，ＶＣＥＧ专家组给出了Ｈ．２６Ｌ新的测试模型删Ｌ广８；随后在２００１年，ＭＰＥＧ专家组也认可了Ｈ．２６Ｌ标准的发展潜力，并且与ＶＣＥＧ合作成立了联合视频专家组（ＪｏｉｎｔＶｉｄｅｏＴｅａｍ，ＪＶＴ）共同致力于新标准的研制。２００３ｐａｒｔ年５月，该标准正式推出，定名为Ｈ．２６４／ＭＰＥＧ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ，ＡＶＣ）。１０，官方叫法是先进视频编码Ｈ．２６４继承了Ｈ．２６３＋、Ｈ．２６３＋＋中一些行之有效的可选模式，如先进帧内预１２Ｈ．２６４编码器的ＤＳＰ实现与优化测模式，基于上下文的算术编码模式等，同时加入了一些新的研究成果。与Ｈ．２６３基本框架相比，主要的改进有：１／４（１／８）象素精度的运动估计、７种不同尺寸块的运动矢量估计、整型ＤＣＴ运算等。作为新的视频编码标准，Ｈ．２６４具有低码率、高质量、数据错误／丢失的鲁棒性、不同网络环境下操作的可变性等优点，所以在高质量实时传输领域，Ｈ．２６４具有无可比拟的强大优势。正因为此，本课题选用Ｈ．２６４进行ＤＳＰ上的移植与优化。在以后的章节将对Ｈ．２６４标准作详细介绍。１．４研究背景与选题如前所述，现代化的社会工作方式的不断发展，传统的以单一语音为主的媒体交流方式已经无法满足社会与人民的需要。随着通信技术和网络技术的发展，现代多媒体技术随着编码技术、计算机技术、数字信号处理技术、大规模集成电路技术的发展．已经成为现代信息社会的一个显著特征。多媒体发展在社会上有广阔的应用背景。Ｈ．２６４正是因为其良好的压缩性能和网络友好性等新特点而成为目前视频存储和图像通信研究领域的一个热点问题。实现Ｈ．２６４实时编码是其中一个很重要的研究方向，尤其在移动视频、视频会议、电视电话等视频实时应用场合具有非常重要的研究意义和实用价值。视频压缩编码的实现主要有三种可能途径：基于ＰＣ的纯软件实现、纯硬件实现、软硬件相结合实现。随着视频压缩标准的不断发展与完善，算法的运算量和复杂度也就随之而提升，Ｈ．２６４视频压缩编码算法也不例外。用基于ＰＣ的纯软件的方法来实现Ｈ．２６４实时压缩非常困难，尤其对于高分辨率的图像来说几乎是不可能的．同时，就纯硬件实现来说，虽然通过设计制作高性能的专业视频处理芯片的方法来完成视频编解码一度在视频压缩系统中占据了主导地位，但专用的视频处理芯片固有的灵活性差和高成本缺点却极大地限制了该方法的普及。而通用的数字信号处理器（ＤＳＰ），由于其高度可编程性、超强的数据吞吐能力和运算速度、使产品能够迅速应用新算法、快速地进行产品升级，这些优点使得以ＤＳＰ为核心处理器的软硬件相结合的方法成为了目前国际上和国内实现Ｈ．２６４实时编码的一种可行的、有效地，快速的途径．Ｂｌａｃｋｆｉｎ系列ＤＳＰ是美国模拟器件公司（ＡＤＩ，ＡｎａｌｏｇＤｅｖｉｃｅＩｎｓｔｒｕｍｅｎｔｓ）于２００３年推出的新一代处理器，其性能是传统ＤＳＰ和嵌入式处理器的两倍而功耗仅为它们的一半，ＢＦ５６１更是其中的佼佼者。Ｂｌａｃｋｆｉｎ系列的重点在消费类多媒体，针对视频和图像处理领域应用。ＢＦ５６１因其运算性能良好、功能全面等特点而成为目前实现Ｈ．２６４视频编码器的理想平台之一。本课题的目的就是通过利第一章绪论１３用ＡＤＢＦ５６１高性能ＤＳＰ加Ｈ．２６４编码算法软硬件相结合的方法来实现Ｈ．２６４算法的实时编码。具体而言就是在充分研究Ｈ．２６４编码算法的基础上，在保持良好的图像质量和编码效率的同时，通过提出新的快速有效的算法和采用各种代码优化方法来减小原Ｈ．２６４编码算法的运算量，提高编码速度，最终实现以ＡＤ为平台的实时Ｈ．２６４压缩编码器。ＢＦ５６１１．５内容安排本文以Ｈ．２６４的标注参考模型ＪＭ８５为蓝本，采用ＡＤＩ的Ｂｌａｃｋｆｍ５６１作为主处理平台，研究视频编码算法在ＤＳＰ上的移植和优化过程．本文主要内容安排如下：第一章序论部分简单介绍了视频压缩编码的基本方法，基于块匹配混合编码框架的构成以及主要视频编码标准的特点和本课题的研究目的。第二章较详细地介绍了Ｈ．２６４／ＡＶＣ标准的特点和其中包含的新技术，包括其分层的体系结构以及视频编码层的新特性，最后指出了复杂度是Ｈ．２６４未被广泛采用的主要因素之一，必须进行算法和平台的快速优化。第三章介绍了开发使用的硬件环境，包括ＤＳＰ芯片的结构特点、外设接口、流水线、以及开发用软件平台的特点．第四章选择ＪＭ８５，根据选用的硬件特点，详细进行了ＰＣ机的Ｃ算法级，ＰＣ机到ＤＳＰ的移植和ＤＳＰ平台上的ＤＳＰ代码优化，实现了ＤＳＰ平台上的视频编码。最后一章为全文总结，并对下一步的工作进行了展望第二章Ｈ．２６４视频编码器的分析与实现１５第二章Ｈ．２６４视频编码器的分析与实现如前所述，目前较为经典和广泛使用的图像压缩编码方法是混合编码，即通过减少统计冗余来达到压缩图像数据量的目的‘”Ⅱ“。Ｈ．２６４也不例外。它在技术上不但集中了以往标准的优点，而且对关键算法进行了改进，使其在图像质量、编码效率、压缩率及网络适应性、容错性等方面均较以往的视频压缩标准有较大改善。与以往标准相比，Ｈ．２６４主要有以下优点Ｉ删：●在相同重建图像质量下比Ｈ．２６３＋署ｑ］ＭＰＥＧ－４（Ｐａｒｔ２）节约５０％码率； ●可在很宽的码率范围内提供高质量的视频服务；?对信道时延的适应性较好，既可工作于低时延模式以满足实时业务，如会议电视等，又可工作于无时延限制的宽松场合，如视频存储等：?具备较强的抗误码能力，包括支持传输环境恶劣的无线网络； ●采用分层模式：视频编码层（ＶＣＬ，ＶｉｄｅｏＣｏｄｉｎｇＬａｙｅｒ）和专用于网络传输的网络抽象层（ＮＡＬ，ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔｉｏｎＬａｙｅｒ），进一步提高网络适应能力：２．１Ｈ．２６４的基本框架如图２－１所示，Ｈ．２６４按功能将视频编码系统分为视频编码层（ＶＣＬ）和网络抽象层（ＮＡＬ）两个层次‘“。ＶＣＬ完成对视频序列的高效压缩；ＮＡＬ规范视频数据的格式，主要提供头部信。。。合各种媒体的传输和存储。ＮＡＬ作为Ｈ．２６４标准的一部分正式定义了视频编／解码器和外部网络之间基于包的接口，以便将ＶＣＬ层视频流进行协议封装后通过ＮＡＬ集成到传输层。Ｉ甲卜／孑瓢二二８ｌＩ一本氟蜃ＩＩ一＊彝屠?甲”酱艋Ｉ～ｌ存取屉■舢檀口上存取囊一ａｌ图２－１Ｈ．２６４的分层结构图ＮＡＬ层把数据封装成为若干网络抽象单元（ＮＡＬＵ，ＮＡＬｕｎｉｔ），这些网络抽１６Ｈ．２６４编码器的ＤＳＰ实现与优化象单元可以在现有的大部分网络中以包的形式传送。封装于网络抽象单元的中的数据称为原始字节序列载荷（ＲＢＳＰ，ＲａｗＢｙｔｅｓＳｅｑｕｅｎｃｅＰａｙｌｏａｄｓ）．根据ＲＢＳＰ的不同，网络抽象单元中可以分为不同的类型。Ｈ．２６４中的ＲＢＳＰ主要分为两种：一种为视频编码数据，一种为控制数据。视频编码数据可以以ｓｌｉｃｅ（每个ｓｌｉｃｅ由若干宏块组成）为单位进行组织，也可以对ｓｌｉｃｅ进行数据分割，即将每个ｓｌｉｃｅ中编码后的数据按类型分为三种，同类型的数据组织到一起，形成三个数据划分（ＤａｔａＰａｒｔｉｔｉｏｎ），视频编码数据以数据划分为单位进行组织，其中控制数据是指视频序列参数、图像参数等信息。对于解码端，可以认为这些网络抽象单元或者正确无误，或者在网络中丢失，或者存在位错误。一般网络抽象单元头信息中会设有相应标志来指示是否发生位错误，解码器能够识别发生位错误的网络抽象单元并决定是对其进行解码还是丢弃。ＶＣＬ层主要研究基于混合编码中涉及到的常规的运动补偿，变换编码、熵编码等编码技术，来提高视频信号的编码效率。使用ｓｌｉｃｅ技术，将一个待编码图像分割成许多宏块来处理。―般ＶＣＬ的主要任务如下：１、通过分块技术将对整帧的处理降到对块的处理，来降低视频处理时问；２、通过变换、量化和熵编码方式对原始块进行编码，以达到降低视频帧在空间上存在的冗余度的目的。３、采用运动估计和运动补偿技术只对残差数据进行编码，以降低时间冗余。Ｈ．２６４的ｖＣＬ层压缩算法是在Ｈ．２６３和Ｈ．２６３＋的基础上发展而来的，也采用与Ｈ．２６３和ＭＰＥＧ－４类似的基于块的混合编码方法，采用帧内（Ｉｎｔｒａ）和帧间（Ｉｎｔｅｒ）两种编码模式。编码都以宏块为单位进行，对于Ｉ帧图像采用帧内模式编码，对于Ｐ帧和Ｂ帧图像则采用帧间模式编码，通过复杂的帧间预测来减少运动图像的时间冗余，通过对预测残差进行ＤＣＴ变换来减少空间冗余。Ｉｎｔｒａ编码的基本流程为：选择宏块的帧内预测模式――帧内编码一对残差数据进行变换和量化一一对量化后的系数进行变长编码和算术编码一生成重构块（用于后继块编码时图２－２ｔＬ２６４编码器框图第二章Ｈ．２６４视频编码器的分析与实现１７的参考）．Ｉｎｔｅｒ编码流程为：多模式运动估计――根据率失真优化算法选择编码模式――运动补偿产生残差数据――对残差数据进行变换、量化和熵编码。Ｈ．２６４编码器框图如图２－２所示（编码器中也包含解码器部分）【．７ｌ编码时，首先把当前帧，＾划分成宏块。宏块有帧内和帧间两种模式，帧内模式使用当前帧内已编码的宏块进行预测；帧间模式使用以往一个或多个帧作为参考进行运动预测。然后，对预测值和原始值的差值Ｄ进行整型变换、量化、重新排序和ｖｉｅ编码，最后将运动向量ＭＶ和每个宏块的头信息进行熵编码，产生压缩数据流进行传输。对量化系数ｘ进行逆量化、反变换后，与预测系数相加，得到未经滤波的肛Ｆ帧，对弘Ｆ帧进行滤波，得到当前重构帧《．解码过程对应于编码器的各部分进行逆向操作，即可输出重构图像数据。具体过程为：对每个块进行再量化，逆转换产生差值Ｄ’，因为是不可逆量化，所以Ｄ’与Ｄ不同；将运动补偿预测Ｐ加到Ｄ’上产生重构块，各重构块存储起来以便产生重构帧《。一个完整的帧被解码后生成的《就可输出显示了，也可保存起来用作参考帧以生成下一帧《．，。２．２Ｈ．２６４的输入图像格式类型Ｈ．２６４支持的视频源格式包括ＹＬｒＶ４：２：０、４：２：２和４：４：４，同时支持逐行扫描和隔行扫描的视频序列；对于隔行扫描的视频帧，Ｈ．２６４支持将奇偶场进行独立编码，也支持将奇偶场一起编码的方式。目前，Ｈ．２６４主要针对采用ＹＵＶ４：２：０采样的视频序列进行压缩编码。其中视频序列的一帧可以由连续的数据构成，也可以由两个交织场（奇场和偶场）来构成。为了统一，无论编码数据的组织方式是连续的还是由交织的两场构成，都统ＸＸ × ＸＸｏ ×× ×’ｃＸＸｏＸ × ｏ×ＯＸ ×¨?Ｘ０ ×× ａ × × ａＸ× × × ＸＸ ×Ｘ× × Ｘ× ｏ ×●●●×ｏ ××。亮度分量ｏｔ色度分量图２－３４：２：０采样亮度和色度分量的排列情况Ｈ．２６４编码器的ＤＳＰ实现与优化～称为一帧图像（Ｐｉｃｔｕｒｅ）。图２．３说明了采用ＹＵＶ＆２：０采样方式时亮度和色度分量的关系。２．３Ｈ．２６４视频编码层的新技术为了提高编码效率、压缩比和图像质量，Ｈ．２６４在继承了许多优秀的编码技术的同时又采用了很多全新的编码技术，这些技术包括：先进的帧内预测，更多的块划分种类，多预测参考帧，多模式运动估计及１／４、１／８象素精度的运动估计，残差图像的整数变换编码、环路滤波和先进的熵编码技术等。根据对于以上技术的使用情况的不同，Ｈ．２６４还将编码划分为４个档次（Ｐｒｏｆｉｌｅ），以便于不同应用场合选择不同的编码档次。各个编码档次及所采用的技术如下； ?基本档次（ＢａｓｅｌｉｎｅＰｒｏｆｉｌｅ）：支持ｌ’Ｐ帧、ＣＡＶＬＣ编码、ｓｌｉｃｅ分组、冗余帧、ｓｌｉｃｅ随机排序（ＡＳＯ，Ａｒｂｉｔｒａｒｙ（ＦＭＯ，ＦｌｅｘｉｂｌｅＭａｃｒｏｂｌｏｃｋＳｌｉｃｅＯｒｄｅｒｉｎｇ）及宏块灵活排序Ｏｒｄｅｒｉｎｇ）；主要应用于低时延的实时应用场合。 ●主档次（ＭａｉｎＰｒｏｆｉｌｅ）：支持ｌ、Ｐ、Ｂ帧、ＣＡＶＬＣ、ＣＡＢＡＣ编码；主要针对对时延要求不高，但压缩率和质量要求较高的场合． ●扩展档次（ＥｘｔｅｎｄｅｄＰｒｏｆｉｌｅ）；具有基本档次ＢａｓｅｌｉｎｅＰｒｏｆｉｌｅ的全部技术，另加对Ｂ、Ｓ鹏Ｐ帧的支持；主要针对各种网络视频流传输方面的应用。?高档次（ＨｉｇｈＰｒｏｆｉｌｅ）：新增档次，具有主档次（ＭａｉｎＰｒｏｆｉｌｅ）的所有特征，但支持高于８ｂｉｔｓ／样值位深，还增加了８×８整型变换、基于感知的量化缩放矩阵以及视频中指定区域的无损压缩等功能，主要应用于高保真视频。２．３．１帧内编码帧内编码的思想是根据同一帧内的相邻宏块间具有空间相关性，特别是当相邻象素位于同一视频对象中（如背景区域）时，其相关性极强的特点，采用对点的预测编码算法去除这种空间相关性，从而降低Ｉ帧的编码流长度。为了进一步提高帧内编码的效率，Ｈ．２６４利用相邻宏块的空间相关性来进行帧内预测编码。对一个给定的宏块。利用其周围的相邻宏块对当前宏块进行预测。Ｈ．２６４的帧内预测编码中，对亮度块做帧内编码时可以按１６Ｘ１６（Ｉｎｔｒａｌ６Ｘ１６）和４Ｘ４（Ｉｎｔｒａ４Ｘ４）两种方式进行块的划分。对于图像中变化缓慢的部分，采用１６Ｘ１６块预测；对于需要进行细化的图像部分，则采用４Ｘ４块预测。其中在Ｉｎｔｒａｌ６Ｘ１６方式下有４种预测模式，Ｉｎｔｒａ４Ｘ４方式下有９种预测模式；各种第二章Ｈ．２６４视频编码器的分析与实现１９预测模式如图２－４，图２．６所示。同时，对于８Ｘ８色度块，使用Ｉｎｔｒａｌ６Ｘ１６对应的４种预测模式。在进行预测前，要对与当前块相邻的左、上方重构块进行分类，然后根据不同的分类，采用率失真优化算法，遍历其可用的各种预测模式来选择最终的块划分方式及相应的预测模式算法。０（ｖｅｔｔｉｃａｌ）图“１６ｘ１６亮度块的预测模式＾ＢＣＤＥＦＯＨＯ●ＪＫＬＦ订］｜Ｉ¨－ｌＩ竺１２｜．ｆ?ｈＩ１ｌＭＨＯＰ√．彦ｊ砀’ ‘ｐ图２－６帧内预测模式方向图２－５用于帧内预测的象素在做帧内编码时，Ｈ．２６４更充分地利用了邻近的重构块的信息，这样就能更大程度地减少空间冗余，增强压缩比。同时使用的４Ｘ４的九种预测模式，很好地保留了图像细节部分信息，提高编码图像的质量。当然，在计算上也复杂了很多，因为宏块的编码分析要占用大量的时间，而且无论是Ｉｎｔｒａ还是Ｉｎｔｅｒ编码，在对宏块的编码模式选择进行分析时都要Ｉｎｔｒａ分析，所以在优化Ｈ．２６４编码算法时，对Ｉｎｔｒａ模式选择的优化具有非常重要的意义，可以达到整体上提高编码速度的目的。２．３．２帧间编码与以往的视频编码标准类似，Ｈ．２６４也使用块匹配的帧间预测以消除视频序列的时域冗余。在其它视频编码标准中只定义了两种块的大小，以象素为单位，分别是１６Ｘ１６和８×８的正方形块（８×８的块是在Ｈ．２６３和ＭＰＥＧ－４中定义的）。但由于视频图像的复杂性，在较大的块中可能包含多个具有不同运动状态和不同Ｈ．２６４编码器的ＤＳＰ实现与优化形状的对象。特别是在运动剧烈的局部区域中，用１个１６Ｘ１６或４个８×８运动矢量并不能准确地描述一个宏块全部的运动细节。大量实验表明，对于图像中变换缓慢的部分采用较大的块并不会降低估计精度；对于变化较剧烈的运动物体，采用较小的块可以提高运动估计的精度。为此，Ｉ＂Ｉ．２６４帧问预测支持７种不同尺寸和形状的宏块及子宏块分割，分别为：１６Ｘ１６、１６×８、８Ｘ１６、８×８、８×４、４Ｘ８、４Ｘ４，如图２．７所示，通过率失真优化算法（ＲＤＯ，ＲａｔｅＤｉｓｔｏｒｔｉｏｎＯｐｔｉｍｉｚａｔｉｏｎ）来选择不同的块尺寸．１６ｘ８８ｘ１６１６ｘ１６８ｘ８口日田田８ｘ８８ｘ４４ｘ８４ｘ４口日田田图２－７宏块和子宏块分割Ｈ．２６４的帧间编码仍然是基于运动估计和补偿，以消除时域相关性，这是压缩效率的重要来源。其主要特点如下： ●Ｈ．２６４中基于运动补偿的块（宏块、宏块分区、宏块子分区）可动态选择块的形状及大小，编码的灵活性好。 ●支持亚象素运动矢量：通过在参考帧象素间内插预测参考值可获得１／４、１／８象素精度的运动矢量。这样可以显著提高预测精度，提高压缩效率。 ?帧间预测可以基于单帧或多帧模式，这不仅使预测的精度得以提高，压缩口口口口围Ｉ－ｌ圆固圈囤口口口口效率上升，而且也增强了抗误码干扰的能力。第二章Ｈ．２６４视频编码器的分析与实现量进行编码所需要的码率两方面的因素。Ｈ．２６４支持亮度分量的１／４象素精度和色度分量的１／８象素精度的运动估计，利用６抽头滤波器（１，－５，２０，２０，．５。１）产生１，２象素，再线性插值产生１／４象素；４抽头滤波器产生１／８象素。各精度象素位置如图２－８所示，图２－８中大写字母表示整数象素位置，小写字母表示分数象素位置。帧间编码的两大主要模块就是匹配块的搜索和运动补偿两部分。搜索匹配块时，检查的点越多，搜索范围越大，则匹配精度越高；运动补偿时，精度越高，所计算的运动矢量就越接近实际值；进而计算得到的残差数据就越小，压缩比和图像质量也会越高。同时这样也使得运算量增大，计算过程更加复杂，占有更多的处理时间。据统计，帧间编码的运动估计部分占用整个编码算法的８０％以上，所以，对运动估计中的块匹配和运动补偿，特别是需要搜索很大数量的匹配点的块匹配算法的优化将对整个Ｈ．２６４编码算法速度的提升起到关键性的作用。２．３３整数变换和量化Ｈ．２６４中采用了基于４Ｘ４块的整数ＤＣＴ变换，并根据待变换残差块的不同类型采用了４Ｘ４哈达玛变换和２Ｘ２哈达玛变换，如图２－９所示为宏块中的变换块及其传送顺序。图２－９中，编号为．１的块是在采用Ｉｎｔｒａｌ６Ｘ１６模式编码时０－１５号４Ｘ４子块经整数ＤＣＴ变换后的ＤＣ系数再经４Ｘ４的哈达玛变换的结果；块壳度妇图２－９宏块中的变换块及其传送顺序１６，１７是色度块的ＤＣ系数进行２Ｘ２哈达玛变换的结果；其余的２４个块则进行４Ｘ４整数ＤＣＴ变换。与以往标准中所采用的基于浮点运算的８×８ＤＣＴ变换相比，Ｈ．２６４中的整数ＤＣＴ变换具有以下优点： ●所有运算都是整数运算，不存在舍入误差，故避免了编码和解码端做正变Ｈ．２６４编码器的ＤＳＰ实现与优化换及相应的反变换时出现的“失配”的问题。整数运算较浮点数运算要快很多，而且还可以减轻由于使用较大的８×８块做变换，因降低了相邻块之间的相关性，而产生的高压缩比时出现的块效应。●变换中通过近似和尺度变换，使得正、反变换的运算中仅仅包含了移位和加（减）法运算。●将用于消除尺度变换影响而进行的乘法运算整合到了量化和反量化运算过程中，减少了整体的运算量。整个变换过程可以使用１６位运算，这对于采用快速算法是十分有利的。当然，与浮点运算相比，整数ＤＣＴ变换会引起一些额外的误差，但因为ＤＣＴ变换后的量化也存在量化误差，与之相比，整数Ｄｃｒ变换引起的量化误差影响并不大。另外，其无乘（除）法，只涉及到移位，很大程度上消除了除法运算时经常会产生的取整误差，进一步提高了编码效率和质量。正是这些特点，使得Ｈ．２６４非常便于定点ＤＳＰ的实现和优化Ｈ．２６４中可选５２种不同的量化步长，这与Ｈ．２６３中有３１个量化步长很相似，但是在Ｈ．２６４中，步长是以１２．５％的复合率递进的，而不是一个固定常数。在编码端，这个过程包括前向变换、ｚｉｇ－ｚａｇ扫描、量化熵编码。２．３．４熵编码Ｈ．２６４中，熵编码是针对控制数据（一个视频序列和一帧图像的头信息等）以及前面运算得到的结果数据（预测得到的残差值作正交变换和量化后的结果数据，运动矢量等）．由于这些数据理论上是不允许有失真的，尤其是控制数据，否则，解码端将无法正确恢复数据；所以，Ｈ．２６４采用无失真的熵编码方法对这类数据进行压缩。Ｈ．２６４中的熵编码有两种类型：一种是采用基于指数型Ｇｏｌｏｍｂ码的统一变字长编码（ＵＶＬＣ，ＵｎｉｖｅｒｓａｌＶａｒｉａｂｌｅＬｅｎｇｔｈＣｏｄｉｎｇ）来对除了交换系数之外的所有语法流元素进行编码。扫描变换系数得到的数据采用更灵活的基于上下文的自适应变长编码（ｃＡＶＬＣ），这也是Ｈ．２６４中默认的熵编码方式。Ｈ．２６４提供的另一种编码就是一种基于上下文的自适应二进制算术编码（ＣＡＢＡＣ），这种熵编码比默认的ＣＡＶＬＣ方式复杂度大得多，但压缩效率要优于Ｃ越ｌｒＩＣ，因而作为Ｈ．２６４的ＭａｉｎＰｒｏｆｉｌｅ中的一个可选项。Ｈ．２６４的熵编码元素中，对图像序列、帧、ｓｌｉｃｅ级的语法元素采用定长或变长的二进制编码，即利用ＵＶＬＣ码表提供的Ｅｘｐ．Ｏｏｌｏｍｂ编码，不管符号表述什么类型的数据，都使用统一变字长编码表。其优点是简单，缺点是单一的码表是从概率统计分布模型得出的，没有考虑编码符号间的相关性，在中高码率时效果第二章Ｈ．２６４视频编码器的分析与实现不是很好；而在ｓｌｉｃｅ级以下层中（如宏块级ＭＢ）的语法元素则采用变长编码ＣＡＶＬＣ或ＣＡＢＡＣ。其中，ＣＡＶＬＣ充分利用了４×４块量化系数的以下一些特征：●通过预测、转换和量化，系数块通常都是稀疏的（含大量的０），ａＷＬＣ利用游程码对长０串进行压缩； ●通过“之”字型扫描的高端的非Ｏ系数通常是一个＋１或．１的序列，ＣＡＶＬＣ将高频系数＋１或．１的数量通过压缩作为信号发出； ●相邻块之间的非Ｏ系数的数量是相关联的，系数的数量是通过查找表进行编码，对查找表的选择依赖于相邻块中非０系数的数量； ●非Ｏ系数个数的数量级在重排序数组的开始（接近直流系数）的地方比较高，在高频部分比较低；ＣＡＶＬＣ充分利用这一点，采用依靠最近编码的数量级自适应选择量级参数查找表的方法。通过这种方法与传统的变长编码（ｖＩ＿Ｃ）的结合，将能更为充分利用信源的各种相关性和人的视觉特性更好地压缩数据，降低所需地传码率。２３．５去块效应滤波由于使用基于块的编码方法，重建块的边界象素因为可用的己知信息相对较少，会比内部象素的精度低，进而会产生块效应。为此Ｈ．２６４定义了一种自适应的环路滤波方法来去除块效应。去块效应滤波可平滑块边界，尤其在高压缩率情况下可很好地改进主观质量；而且使用经滤波后的宏块进行运动补偿可使残差信号减少，有利于提高压缩效率。Ｈ．２６４中环路滤波操作编码端是在对每个宏块完成反变换后，对其进行重构和存储以用于预测其它宏块前进行的，根据宏块中每个块的位置和量化参数不同，对每条块边界设置不同的滤波强度，自适应地调整滤波效果；解码端是在重构和显示宏块之前进行的．由于Ｈ．２６４中变换计算的单位是４Ｘ４块，因此在宏块中也以４Ｘ４块为单位一田田蠢直边抖木Ｖ边并一艘墨曲ａ０）－平垃摊ｑｌｑ２啦图２－１０宏块边界示意图图２－１１４×４块的水平和垂直边界元素进行水平和垂直边界滤波。如图２．１０和图２．１１所示，滤波操作计算顺序为：对１６Ｘ１６亮度宏块的４个垂直和４个水平边界相继进行滤波操作――对８Ｘ８色度Ｈ．２６４编码器的ＤＳＰ实现与优化宏块的２个垂直和２个水平边界相继进行滤波操作．环路滤波的基本思想是：如果测出块边缘附近的采样点问的差值的绝对值较大，则可能会产生方块效应；然而当差值很大且这个差值不可能是由于编码中的量化噪声产生的，那么这个边缘则更有可能是反映了源图像真实的情况，所以这种情况下不应该进行滤波操作。通过滤波操作使块效应减小的同时轮廓清晰度基本上不改变，因此图像的主观质量将大为改善。同时，滤波可使比特率降低大约５．１０％左右，当然也加大了编码的运算复杂度．２．４本章小节Ｈ．２６４主要采用了以下新技术；１、采用多种帧内预测模式，更加合理地利用了Ｉ帧的空间冗余，从而大大降低了ｌ帧的编码码流长度。２、自适应块大小编码模式（ＡｄａｐｔｉｖｅＢｌｏｃｋＳｉｚｅＣｏｄｉｎｇ）：Ｈ．２６４允许使用１６×１６、１６×８、８×１６、８Ｘ８、８×４、４Ｘ８、４×４等子块预测模式和编码模式，采用更小的块和白适应编码的方式，使得预测残差的数据量减少，进一步降低了码率。３、高精度亚象素运动估计：Ｈ．２６４中明确提出了采用亚象素运动估计的方法，并制定１／４和１／８象素可选的运动估计方法，提高了预测精度，同时降低了残差的编码码率．４、多参考帧：传统的视频压缩编码采用一个（Ｐ帧）或两个（Ｂ帧）解码帧作为当前帧预测的参考帧。在Ｈ．２６４中允许最多５个参考帧，通过在更多的参考帧里面进行运动估计和补偿，找到残差更小的预测块，降低编码码率．５、整型变换编码：Ｈ．２６４采用４Ｘ４整数ＤＣＴ变换，采用定点运算代替以往ＤＣＴ变换中的浮点运算。采用这种变换，不仅可以降低编码时间，而且为该算法在多媒体处理平台上的实现带来了方便．在这一点上，Ｈ．２６４视频编码标准更适合作为多媒体终端的编解码标准。６、两种可选熵编码ＣＡＶＬＣ和ＣＡＢＡＣ，提高压缩比。７、去块效应滤波，提高图像质量。以上新技术及在图像质量和压缩比上的提高都是以更复杂的算法为代价的，所以改进算法，提高压缩效率是非常必要的。第三章硬件开发环境第三章硬件开发环境３．１引言美国模拟器件公司（ＡＤＩ）是全世界领先的高性能信号处理集成电路制造商，是全球主要的可编程ＤＳＰ芯片供应商之一。在通用ＤＳＰ市场上，ＡＤＩ占有约４０％的市场份额。ＢｌａｃｋｆｉｎＤＳＰｔ４０－４２１是１６位产品的一个大系列，是ＡＤＩ与Ｉｎｔｃｌ联合开发的体现高性能体系结构的首款第四代ＤＳＰ产品。这一新产品是专为通信和互联网应用而设计的通用ＤＳＰ芯片，能处理广泛用于互联网的大量图像、声音、文本和数据流，适用于电信和各种互联网设备，例如可视电话、游戏设备、网络终端、网络电视和智能手持设备。Ｂｌａｃｋｆｉｎ系列ＤＳＰ目前公布的有ＢＦ５３５、ＢＦ５３１、ＢＦ５３２、ＢＦ５３３和ＢＦ５６１。其中ＢＦ５３５接口丰富，性能优良，而ＢＦ５６１增加了视频处理接口，性价比很高。ＢｌａｃｋｆｉｎＤＳＰ的主要优点如下：１、微信号结构：ＢｌａｃｋｆｉｎＤＳＰ体系结构是在ＡＤＩ和ｈＩｔｅｌ公司联合开发的“微信号结构”（ＭＳＡ）的基础上实现的。这种统一的编程模式由于采用了一个综合的信号处理和控制指令集，而消除了传统的多个不同的处理器之间相联系的复杂性，因为传统的多处理器系统的信号处理和控制系统都在分立的处理器结构上工作。２、动态电源管理：动态电源管理可以通过改变电压和工作频率，提供比其它ＤＳＰ更少的功耗。ＢｌａｃｋｆｉｎＤＳＰ体系结构允许电压和频率独立调整，使每一个单项任务所消耗的能量最小．它的推出使ＡＤＩ的ＤＳＰ性能提高了４倍以上，功耗降低了将近１／３。同时ＡＤＩ为了使这个体系结构独有的动态电源管理特性发挥最大效能，还推出了一个能够控制ＤＳＰ电压和频率的芯片组，使得基于ＢｌａｃｋｆｍＤＳＰ的设计功耗减少了６０％以上。３、高度并行的计算单元：该体系结构内的计算单元使在相同周期内能执行的算术运算的次数最大化。在每一个周期内，每个ＭＡＣ能在４个独立的操作数上执行１６位乘１６位的乘法运算。４０位ＡＬＵ能累加２个４０位的数字或４个１６位的数字。这种体系结构可以处理８位、１６位和３２位的数据字运算。４、高性能地址产生器：２个数据地址产生器（ＤＡＧ）用于产生支持高级ＤＳＰ滤波运算的地址的复合装入或存储单元。对于ＤＳＰ寻址，它支持位倒序寻址和循环缓冲：对于ＲＩＳＣＭＣＵ载入和存储，支持自动增量、自动减量和基地址＋立即偏移量寻址方式．它包括６个３２位地址指针寄存器（Ｐ０～Ｐ５）读取操作数和其它４组３２位寄存器：变址寄存器（１０～１３），修正寄存器（Ｍ０～Ｍ３），基址寄存Ｈ．２６４编码器的ＤＳＰ实现与优化器（Ｂ０～Ｂ３）和长度寄存器（Ｌ０～Ｌ３）。该ＤＡＧ还包括２个用于嵌套零开销循环的循环计数器以及支持传输过程中饱和和限幅的硬件。５、极佳的代码密度：ＲＩＳＣＭＣＵ编码一般都用时较长，因为它是线性写入的。ＤＳＰ编码一般用时较短，并且包含较多的循环周期。ＢｌａｃｋｆｉｎＤＳＰ体系结构支持多种长度指令。该内核能将１６位控制指令与３２位ＤＳＰ指令一起混合并链进６４位组，使内存分组最大。当缓冲和读取内存时，内核自动完全填充总线长度分组，因为它没有排列限制。这两个特点使得内核处理器具有优秀的代码密度处理能力．该内核体系结构很容易为获得最佳软件代码密度提供多指令长度、指令混合及内存排列。基于代码中使用的指令，还能自动混合１６、３２和６４位指令。而无须任何限制、方式切换或代码隔离。６、视频指令；除了支持８位数据――ＲＧＢ象素处理算法公用的字长之外，该体系结构还包括视频指令。例如，用一条ＩＥＥＥｌｌ８０舍入运算支持离散余弦变换（ＤＣＴ）：“ＳＵＭＡＢＳＯＬＵＴＥＤＩＦＦＥＲＥＮＣＥＳ”指令支持视频压缩中使用的运动估计算法．对于霍夫曼（Ｈｕｆｆｍａｎ）编码，该指令集包括一个“ＦＩＥＬＤＤＥＰＯＳＩＴ／ＥＸＴＲＡＣＴ”命令。７、分层结构的内存：分层结构的内存缩短了内核对内存的访问时间，以获得最大的数据吞吐量、较少的延迟和缩短的处理空载时间。此外，内存管理单元（ＭＭｕ）能提供内存保护，当内核工作在用户方式和监控方式时，内存保护支持全部ＯＳ核心。ＯＳ核心在监控方式运行，并且为了实际应用软件在用户方式下运行，将内存单元和其它系统资源分开，而传统ＤＳＰ则不具有这种独特而强大的功能。８、集成更多的外围设备．９、该系列中部分芯片配有专用视频接口，如ＢＦ５６１。３．２ＡＤＳＰ．ＢＦ５６１芯片介绍ＡＤＳＰ．ＢＦ５６１采用双ＭＡＣ的结构具有正交的类似ＲＩＳＣ的微处理器指令集，主频高达６００ＭＨＺ，有专门的视频处理指令相对应，还有灵活的ＳＲＡＭ和ＣＡＣＨＥ结构可供自由使用，是一款在多媒体处理与网络传输方面极具特色的芯片。这样的芯片结构不但易于编程，可以快速地进行信号和多媒体的处理，而且方便扩展ＵＳＢ、ＰＣＩＩ／Ｏ、ＵＡＲＴ、ＳＰＯＲＴ等接口．３．２．１芯片结构芯片的结构见图３－１，其特点如下： ?１６位定点ＤＳＰ内核，可以实现６００ＭＨｚ的连续工作；第三章硬件开发环境图３－１ＡＤＳＰ－ＢＦ５６１结构框图灵活的软件控制动态电源管理；４ＧＢ统一寻址空间；Ｌ１指令寄存器，由１６ＫＢｙｔｅｓ４路相级联的ＣＡＣＨＥ和１６Ｋｂｙｔｅｓ的ＳＲＡＭ组成，ＣＡＣＨＥ存储器也可以配置成ＳＲＡＭ：Ｌ１数据存储器，由４个１６ＫＢｙｔｅｓ的Ｂａｎｋ组成，ｕ数据存储器的两个Ｂａｎｋ可配置成２路组相联ＣＡＣＨＥ或一个ＳＲＡＭ，另外两个Ｂａｎｋ被配置成ＳＲＡＭ：●４Ｋｂｙｔｅｓ的临时数据ＳＲＡＭ，和Ｌ１存储器有相同的运行速度，但只能作为数据ＳＲＡＭ，不能配置为ＣＡＣＨＥ或通过ＤＭＡ访问；提供１２８Ｋｂｙｔｅｓ高速ＳＲＡＭ的Ｌ２ＳＲＡＭ存储器阵列，以内核速度的一半进行访问，比访问Ｕ存储器Ｂａｎｋ有稍多的延迟；支持片外同步或异步存储器（包括ＰＣＩ３３ＳＤＲＡＭ）；灵活的引导方式（内部或外部存储资源）；内存管理单元提供内存保护；事件处理；２个ＷａｔｃｈＤｏｇ定时器；●● ● ● ● ● ● ● ● ● ●１２个通用３２－ｂ“定时／计数器，支持ＰＷＭ；ＳＰＩ兼容端口；２个双通道全双工同步串行端口，支持８个立体声ｆ２ｓ通道；２个１６通道ＤＭＡ控制器和１个内部存储器ＤＭＡ控制器；支持ＩｒＤＡ的ＵＡＲＴ；Ｈ．２６４编码器的ＤＳＰ实现与优化●１Ｘ～６３×倍频的片内ＰＩｂ●２个可直接与并行Ａ／Ｄ和Ｄ／Ａ转换器、符合ＩＴＵ．６０１／６５６标准的视频编码和解码器以及其它通用外设连接的并行接口（ＰＰＩ）：●０．８－１．２Ｖ内核电压，兼容３．３Ｖ及２．５ＶＩ／Ｏ；３．２．２ＤＳＰ内核结构Ｂｌａｃｋｆｉｎ内核结构如下图所示，包括２个１６位ＭＡＣ，２个４０位ＡＬＵ，４个８位视频ＡＬｕ，以及１个４０位移位器，ＲＩＳＣ式寄存器和指令模型。图３－２ＡＤＳＰ－ＢＦ５６１内核结构Ｂｌａｃｋｆｉｎ内核是一个改进的哈佛结构，它的内核结构兼有ＤＳＰ和ＣＰＵ的特点。硬件支持运算结果的进位和去尾，支持对８／１６／３２位整形单独进行操作，也可以对１６／３２位浮点形数据类型进行操作。ＳＩＭＤ操作支持８／１６位数据类型操作。３．２．３数据存储区结构Ｂｌａｃｋｆｉｎ的数据存储区很有特点，兼有ＤＳＰ和ＣＰＵ的优点。ＡＤＳＰ．ＢＦ５６１把存储器视为一个统一的４ＧＢ的地址空间，使用３２位地址．所有的资源，包括内部存储器、外部存储器和ＦＯ控制存储器，都占据公共地址空间的各自独立的部分。此地址空间的各部分存储器按分级结构排列，以提供高的性价比．一些非常快速、低延迟的存储器（如ＣＡＣＨＥ或ＳＲＡＭ）的位置非常接近处理器，而更大第三章硬件开发环境的低成本、低性能的存储器远离处理器。内部，外部存储器映射如图３－３所示。■ＲＤ∞∞一■Ⅻ∞∞＿一魄ｌ岫睢暖潮睢Ｌｔ任目圈刚ＮＤ碍■嗍ｌ∞毛岫睡暖帕畦９孽暇帆囊嘲溘甜ＥＩＳ■Ｗ●∞一一Ｕ¨∞■∞ＷＣ■，ｔｎ韵ＨＨ柏Ｕｔ日嘲口Ｈｇ■■嗍Ｈ∞∞ＵＤ田＾融暇Ｂ碍Ｗ‘，口目■Ｎ■扫Ｏ田∞一一娜∞∞－一啊虫哪ＬＩｍＷＢｇＷ惴Ｒ日目＾ｎｍｍ― ｕ咀碍ａ吣哥―■口ａｔ㈣ＬＩ“ｍ酬＾孽蛳●ｃ嘲＊Ｈ蛐Ｕ篮“讥｝啪嗣删÷ＷＲｉＢｍＵ●￥蝌蓐×Ｈ辨■￡：材眚【＇朝Ｈａ目嚏Ｄ－㈣∞∞?―Ｎ霸口＇∞―ＰａＩ确４０００一ａ㈣㈣－＾●’ｑ㈣．．－Ｏｄ再ＯＵＯ■■目目Ｉ－１●Ｅ啊Ｃ●Ｎｇ■■－∞Ｒｊ日ｍＲ｜ＨⅧＵＤ目＾■Ｈ饵翔■啪ＥＣ瞄４ｕ删拍日州Ｂ踊脚ｔｔ峋．＿ａｍⅢ．＿ｍ∞∞∞－ｅ１０４０㈣－ｏｆＲ口哪、Ｕ０目＾叫Ｈ（矗辅■花雌Ｉ●湘ｍ■睁∞∞口口一●ｕｍｍＢ”＾＊糊稍１２∞¨ｆｔｍ拜Ⅸ响Ｒｄ■日×∞ｍ―Ｘ啪∞ａａｐ，＾Ｈ｝ＣＨ■时日呱３嘏忡ＨＮ】Ⅳ釉，一２＾凇¨＾嘣自０Ｋ●＞目日，Ｍ■娴■● ⅨＨ忡．Ｊ目他＂■口抖ｎＶ氍口％｜■∞ ∞Ⅷｍ“３轼明∞时Ｋ２ｇＭｌｍ¨‘１图３－３ＡＤＳＰ．ＢＦ５６１内部／岁｝部存储器映射外部存储系统通过外部总线接口单元（ＥＢＩＵ）进行访问，可以由ＳＤＲＡＭ、ＦＬＡＳＨ和ＳＲＡＭ进行扩展，可以访问多达７６８Ｍｂｙｔｅｓ的物理存储器。内部存储区域根据不同的应用分级，ＬｌＳＲＡＭ和ＳＣＲＡＴＣＨＳＲＡＭ离内核较近，运行速度无延迟，而Ｌ２ＳＲＡＭ离内核较远，所以运行时有延迟。片外同步或异步ＳＤＲＡＭ，由于通过总线接口访问，则延迟更大。ＡＤＳＰ．ＢＦ５６１有４块片内存储器，提供到内核的高带宽的访问。Ｌ１ＳＲＡＭ分为１６ＫＢ指令Ｍｅｍｏｒｙ和１６ＫＢ数据Ｍｅｍｏｒｙ。Ｌ１指令Ｍｅｍｏｒｙ有６４位数据宽度的总线，可以得到不同长度指令的结合。Ｌ１指令Ｍｅｍｏｒｙ可以作为ＳＲＡＭ又可以作为ＣＡＣＨＥ。当被配置为ＳＲＡＭ时，指令ＳＲＡＭ分成４个Ｈ．２６４编码器的ＤＳＰ实现与优化片，每一片只有单通道。而整个指令ＳＲＡＭ是双通道的，核与系统ＤＭＡ都可以访问，所以不能同时访问同一个片，一旦同时出现，系统ＤＭＡ优于内核的取指令操作。ｕ指令Ｍｅｍｏｒｙ还可以设置成指令ＣＡＣＨＥ（高速缓冲通道），当程序较大时，需要将程序代码放在更大的空间中，如Ｌ２ＳＲＡＭ，这时就需要设置成指令ＣＡＣＨＥ，以缩短流水线较长的取指令延迟。ｕ指令Ｍｅｍｏｒｙ可分为四路指令。蛇ＨＥ，每一路有１２８行，每行３２字节。当设置指令ＣＡＣ既时，需要把每一路每一行ＣＡＣＨＥ都设置成无效，然后才打开ＣＡＣＨＥ允许控制。但当设置为ＣＡＣＨＥ后，就不允许使用ＤＭＡ。如果某段程序很常用，可以把这段程序锁定在Ｃ幻：ＨＥ中，以减少时间开销。Ｌ１数据Ｍｅｍｏｒｙ由４个１６ＫＢｙｔｅｓ的Ｂａｎｋ组成，它的两个Ｂａｎｋ可配置成２路组相联ＣＡＣＨＥ或一个ＳＲＡＭ，另外两个Ｂａｎｋ被配置成ＳＲＡＭ．当被配置成ＳＲＡＭ时，存储器每个１６ＫＢａｎｋ被分成４个４Ｋ的ｓｕｂ－ｂａｎｋ，同样有双通道供ＤＭＡ和内核地址产生器寻址使用。和指令Ｍｅｍｏｒｙ相同，Ｌ１数据Ｍｅｍｏｒｙ用作数据ＣＡＣＨＥ时，对于大量的数据情况（如视频数据），可以大大减少对外部ＳＤＲＡＭ读写带来的延时。当设定为ＣＡＣＨＥ时，ＤＭＡ将不能访问数据ＣＡＣＨＥ。Ｌ２Ｍｅｍｏｒｙ共１２８ＫＢ，它既可以作为程序ＳＲＡＭ又可以作为数据ＳＲＡＭ。内核与外部ＦＯ、ＤＭＡ／ＰＣＩ都可以直接访问它。在视频编码器程序中，由于程序的代码量和数据量都较大，Ｌ２可以作为程序与数据的存储区，又作为堆栈的使用区。如果程序在Ｌ２中，一般需要设置指令ＣＡＣＨＥ提高速度，因为如果不设置ＣＡＣＨＥ，每次取指令只能６４位长度，等执行完以后还需要等待７个周期才能执行下一条语句。但如果设置ＣＡＣＨＥ，一条执行完后，流水线操作下一条指令立即执行，这样基本可以减少不必要的延迟．除此之外，ＡＤＳＰ．ＢＦ５６１还提供一个４ＫＢ的临时数据ＳＲＡＭ，它和ＬＩＭｅｍｏｒｙ有相同的运行速度，但是只能作为数据ＳＲＡＭ（不能配置为ＣＡＣＨＥ，也不能通过ＤＭＡ访问）。外部ＳＤＲＡＭ有四块空间，每一块容量可以是１６Ｍ到１２８Ｍ字节，通过外部总线接口单元（ＥＢＩＵ）进行访问。还有四个“Ｍ空间支持异步Ｍｅｍｏｒｙ，另外有１２８Ｍ空间作Ｐａ数据空间。在视频编码器的输入部分，由于视频数据量太大，所以需要放在外部ＳＤＲＡＭ中，这时可以使用异步Ｍｅｍｏｒｙ将数据通过ＤＭＡ方式传输到ＳＤＲＡＭ中。３．２．４ＤＳＰ主要外设接口１、外部总线接口单元（ＥＢＩＵ）外部总线接口单元（ＥＢＩＵ）提供与外部存储器的无缝接口，包括一条１６ｂｉｔ第三章硬件开发环境宽度数据总线，一条地址总线，一条控制总线。１６ｂｉｔ和８ｂｉｔ访问均支持。２、ＤＭＡＡＤＳＰ．ＢＦ５６１使用直接存储器访问（ＤＭＡ）进行存储器空间内部或者存储器空间与外设之间的数据传输。ＤＭＡ控制器允许处理器或外部设备指定数据传送操作，然后返回到正常操作中．ＤＭＡ控制器传送数据的过程独立于处理器的活动。ＤＭＡ控制器传送数据的方式有下面几种： ●存储器一一存储器（ＭｅｍＤＭＡ）； ●存储器一一串行外设接口（ＳＰＩ）； ●存储器一一串行接口； ●存储器一一ｕ越盯口； ●存储器一一ＵＳＢ口ＤＭＡ传送可以是基于描述符的，也可以是基于自动缓冲的。基于描述符的ＤＭＡ传送在发起ＤＭＡ传送序列时，需要一组存储在存储器中的参数，这类传输允许将多个ＤＭＡ序列链接在一起。在基于描述符的ＤＭＡ传送中，一个ＤＭＡ通道可以被编程建立，并且在当前序列完成之后自动启动另外一个ＤＭＡ传送；基于自动缓冲的ＤＭＡ传送允许处理器直接编程ＤＭＡ控制寄存器，以发起一个ＤＭＡ传送。传送完成时，控制寄存器将它们的原始设置值自动更新。３、ＴＩ～咂ＲＡＤＳＰ．ＢＦ５６１具有１２个通用可编程定时器、１个核心定时器和１个看门狗定时器。４、ＵＡＲＴＡＤＳＰ．ＢＦ５６１提供１个全双工的通用异步接收／发送（ｕＡＲＴ）端口，它与ＰＣ标准的ＵＡＲＴ完全兼容。ＵＡＲＴ在串行和并行格式之间转换数据。串行通信遵循支持多种字长、停止位和奇偶校验的异步协议，它也包括调试解调器控制和中断处理的硬件。３．２．５指令和流水线结构由于指令和流水线结构与程序的执行和代码的优化有最直接的关系，所以下面具体介绍其结构和执行过程。Ｂｌａｃｋｆ＇ｍ指令长度有三种，１６位和３２位单指令，６４位并行指令。６４位并行指令由一个３２位指令和２个１６位指令组成。并行指令允许对两个单元同时读或者一个读一个写，但是不支持两个存储单元同时写。例：ＡＩ＋－ＲＯａｒ－／‘Ｒｉｄ／，Ａ０＋－Ｒ０．Ｌ‘ｍ上ＩＩＲ２－【１０＋＋】０【１１＋＋】ｔＲ３；Ｈ．２６４编码器的ＤＳＰ实现与优化在这个例子中，有两个乘法／力口法器操作，一个读一个写操作，还有地址指针自加操作。Ｂｌａｃｋｆｉｎ有八级流水线结构，如图３－４所示：姗Ｆｅ位ｈＩｌ码醴Ｆｅｌｃｈ２ｌｎ瞄Ｄ屯ｃｏｄｃｈ敏Ａｄｄｒｅｓｓｃ蛆ｃＥｘｌＥｋｌＤ∞Ｏ赴＾∞ｍ蠲ｔａｌｃ自ｄＥ妇ＷＢｌ点，Ｉｎｓｌ＆ｔｃｈ２岛吐Ｅ妇Ｗ雷图３－４沉水线结构第一步从ＳＲＡＭ中开始取指令，第二步取出指令后完成指令的排列，第三步开始指令的解码和读取寄存器地址，第四步为数据地址的计算或转移地址的获得，第五步从数据寄存器里读取数据，第六步完成读取数据并进行双乘法／累加器计算操作，第七步执行单周期指令，最后一步将数据和指针传递给相应寄存器。由于采用多级流水线结构，而条件分支转移会破坏流水线结构，当发现要转移时漉水线已经多取了指令，这时就必须全部放弃原来所取的指令，又要重新取指令操作，这样就消耗了较多的时间。所以Ｂｌａｃｋｆｉｎ提供了静态分支检测来减少时间的延迟。同时Ｂｌａｃｋｆｉｎ提供了较多的向量操作指令和多媒体操作指令，这些指令对地址的访问都有限定。所以在编程中应尽量采用并行指令和零开销循环来完成算法，进行流水线操作，同时注意地址的变化以避免ＥＸＣＥＰＴＩＯＮ。３．３集成调试环境ＶｉｓｕａｌＤＳＰ＋＋４。５ＡＤＳＰ－ＢＦ５６１支持一整套开发软件和硬件开发工具，包括ＡＤＩ公司的仿真器和ＢｌａｃｋｆｒｏＤＳＰ开发环境下的ｖｊｓｕａｌＤＳＰ＋＋。ＶｉｓｕａｌＤＳＰ＋＋４．５ｊ集成了两大部分，集成的开发环境ＩＤＥ和调试器ＤＥＢＵＧ，支持ＡＳＭ、Ｃ、Ｃ＋＋语言，具有强大的编辑器功能、灵活的工程管理能力、编译功能以及有效的调试控制和可视效果，支持多处理器同时调试能力。ＡＤＩ公司另外还增加了各种库函数，使用起来更加方便。ＶｉｓｕａｌＤＳＰ＋＋４．５系统调试环境可以采用软件模拟（ｓｉｍｕｌａｔｏｒ），也可以使用硬件通过ＪＴＡＧ在ＥＺＫＩＴ评估板上进行试验，还可以通过ＵＳＢ口进行仿真调试．ＶｉｓｕａｌＤＳＰ＋＋调试器有很多重要的特性：灵活的绘图功能使数据更加清楚，这种用图形表示的用户数据使编程者可以快速地确定算法的性能。算法越复杂，这种性能在设计者的计划中就越重要。统计学的特性使编程者可以不用中止程序第三章硬件开发环境就能够得到处理器性能，就像运行了中断一样，这使得开发者不用中断程序的实时性就可以得到重要的代码执行情况，从而在本质上可以找到软件速度和效率的瓶颈，集中改进影响程序性能的地方。除了ＡＤＩ公司所用的软件和硬件开发工具外，还有第三方提供的支持ＢｌａｃｋｆｍＤＳＰ家族的种类繁多的工具。硬件工具包括ＡＤＳＰ．ＢＦ５６１ＥＺ－Ｋｉｔ评价，开发插件。第三方软件包括ＤＳＰ库、实时操作系统和方框图设计工具等。程序编写以及优化调试工作是编码器的核心工作，在后面的章节里将详细进行说明。３．４本章小节本章主要介绍了ＡＤＩＨ．２６４编码器算法。Ｂｌａｃｋｆｉｎ５６１ＤＳＰ平台与编码器算法移植和实现有关的一些结构和特点，熟练掌握这些知识有利于在该平台上快速有效地优化和实现第四章Ｈ．２６４编码器的ＤＳＰ实现与优化第四章Ｈ．２６４编码器的ＤＳＰ实现与优化４．１引言就目前现状而言，国际和国内很多同行在使用ＤＳＰ实现Ｈ．２６４编码算法的课题上做了很多的研究，并且有了一些实际成果。如Ｍｏｏｎｌｉｇｈｔ公司，主要对去块滤波器进行了优化，其编码器支持Ｄ１格式，在ＰｅｎｔｉｕｍＩＶ３．ＩＧＩ－ｌｚＣＰＵ上实现了ＢａｓｅｌｉｎｅＰｒｏｍｅ的实时编码，但不包括ＦＭＯ模式，且对帧内预测模式进行了简化；Ｗ＆ＷＣｏｍｍｕｎｉｃａｔｉｏｎｓ公司基于ＤＭ６４ｘ的ＢＣ－２６４（ＢａｓｅｌｉｎｅＰｒｏｆｉｌｅＨ．２６４编解码器），实现了７２０Ｘ４８０，３０帧／秒ＮＴＳＣ制，以及７２０Ｘ５７６，２５帧，秒ＰＡＬ制的实时编解码；国内杭州海康公司也利用１１的ＤＭ６４２ＤＳＰ芯片实现了Ｈ．２６４４ＣＩＦ的实时编码。由于不能确切知道这些公司所采用的Ｈ．２６４算法提供的各种新技术的细节，而且也不能详细得知其准确的编码质量和编码效率，所以不能简单地评价这些基于ＤＳＰ的Ｈ．２６４编码器的性能，但总的来说这些成果是非常不错的。对于复杂度和运算量相当高的Ｈ．２６４编码算法而言，在现有ＤＳＰ平台上实现Ｈ．２６４实时编码算法的关键在于编码速度的提高，难度在于提高编码速度的同时又要能保持Ｈ．２６４编码器良好的编码性能，不能单纯为了实现实时编码而牺牲太多的图像质量或任意降低编码效率。４．２三大开源编码器评测与选择同以往的视频编码标准相同，Ｈ．２６４仅仅对编码后的码流结构及解码器做了标准化，对编码器各部分的具体实现方法未作规定，这促进了各开发厂商对编码器的灵活实现。目前业内比较流行的开源编码器有三种：ＪＭ，Ｘ２６４及亿６４，为了完成ＤＳＰ实现，首先必须选择合适的算法。ＪＭ是Ｈ．２６４的官方测试代码，由德国ＨＨＩ研究所负责开发，它实现了Ｈ．２６４所有的特性，由于是官方的测试源码，所以学术研究的算法都是在其基础上实现并和ＪＭ比较，但其程序结构冗长，编码复杂度极高；Ｘ２６４是网上自由组织联合开发的兼容Ｈ．２６４标准码流的编码器，由法国巴黎中心学校的研究所学生发起，注重实用，在不明显降低编码性能的前提下，努力降低计算复杂度，摒弃了Ｈ．２６４中一些对编码性能贡献微小的新特性，但它目前没有解码器；Ｔ２６４是由中国视频编码自由组织联合开发的Ｈ．２６４编解码器，和Ｘ２６４的出发点相似，编码器输出标准的Ｈ．２６４码流，解码器只能解Ｔ２６４编码生成的码流。经实验比较，在ＪＭ选用Ｂａｓｅｌｉｎｅ时，运行时间：ＪＭ＞Ｘ２６４＞＇ｒ２６４ｔ重建图像Ｈ．２６４编码器的ＤＳＰ实现与优化主观质量：Ｘ２６４＞ＪＭ＞Ｔ２６４；客观质量（ＰＳＮＲ）：ＪＭ＞Ｘ２６４＞Ｔ２６４；１ｒ２６４首先被摒弃，为了更好的学习Ｈ．２６４的各种新特性以及便于算法研究，主要选择ＪＭ进行ＤＳＰ实现与优化，选定版本为ＪＭ８５（９０以上的版本适用于高保真视频，与课题方向不符）．４．３ＪＭ复杂度分析及优化方向４．３．１参数的配置如前所述，本章中对Ｈ．２６４的复杂度分析是基于ＪｖＴ提供的未经优化的ｃ参考代码在ＰＣ机上的实现，硬件配置环境如下：ＣＰＵ：赛扬１．７Ｇ：内存：５１２Ｍ；ＶＣ６编译，如无特殊说明，下文所有ＰＣ运行环境不变。复杂度可分为时间复杂度和空间复杂度。本文中执行复杂度的指标采用了三个：内存访问频率、峰值存储时间和处理时间。存储器访问频率是指单位时间内内存传输总次数，峰值存储空间指代码占用的最大内存空间，这两项指标反映了空间复杂度，处理时间则是时间复杂度的度量指标，编码性能指标采用峰值信噪比（ＰＳＮＲ）和比特率（ｂｉｔ－ｒａｔｅ）。为了实现实时应用，处理时间是考虑重点．ＪＭ８５可根据不同应用场合，对编码器进行配置。参数配置采用配置文件ｅｎｃｏｄｅｒ．ｄｇ，配置文件参数见附录Ａ。参数选择包括：参考帧的帧数、哈达玛变换、块大小模式选择、Ｂ帧、ＣＡＢＡＣ、ＲＤＯ和运动搜索范围，合理配置以达到编码效率和计算复杂度之间的平衡是一项挑战。配置条件中具有代表性的是最简单配置和最复杂配置，前者包括所有可选项关闭、ｌ帧和Ｐ帧、单一参考帧、运动向量搜索范围为１６．后者包括所有可选项打开、ＩＰＢ帧、五个参考帧、运动向量搜索范围为１６；试验结合文献后，结果如表４．１所示：表４．１ＪＭ最复杂与最简单配置比较ＰＳＮＲ增加０．５－０．７比特节省２５％＿３８％峰值存储空间比例７内存访问频率比例４０处理时间比例３５配置不同将造成较大的复杂度差异，这是由不同可选项累积而来。峰值存储空间仅仅与参考帧的个数有关：而内存访问频率和处理时间则与较多因素相关，包括不同的块大小、哈达玛变换、率失真优化、Ｂ帧、ＣＡＢＡＣ、运动向量分辨率、搜索范围及多参考帧等，为了达到平衡，同时考虑到ＤＳＰ内存较小的特点及课题应用，选择ｂａｓｅ

为什么盖住OPPOR11最后一颗牙齿被肉盖住镜头，另最后一颗牙齿被肉盖住不能用

我要回帖

更多关于灯太亮用纸张盖住可以的文章

随机推荐

为什么盖住OPPOR11最后一颗牙齿被肉盖住镜头，另最后一颗牙齿被肉盖住不能用

我要回帖

更多关于 灯太亮用纸张盖住可以 的文章

随机推荐

更多关于灯太亮用纸张盖住可以的文章