Computer Engineering and Applications计算机工程与应用 2007,43(30)83 基于距离预测的快速自适应运动估计算法 谭琳 2,李丽娟1 TAN Lin 一,LI Li-juan 1.湖南大学计算机与通信学院,长沙410083 2,中南林业科技大学,长沙410004 1.School of Computer and Communication,Hunan University,Changsha 410083,China 2.Central South University of Forestry and Technology,Changsha 4 10004,China TAN Lin,LI Li-juan.Fast adaptive motion estimation based on distance prediction.Computer Engineering and Applications,2007,43(30):83-84. Abstract:Since most of the existing fast motion search algorithm seldom examine all possible candidates within a search area, they may fail to find the optimum point for sequences having fast and/or random motions.To alleviate this problem,proposes a measure estimating the distance between the current search point and the optimal point,which combines with hierarchical searches.The proposed algorithm improves search speed of sequences with fast and/or random motions as well as PSNR performance. Key words:fast motion es【ima【ion;dis【ance prediction;hierarchical search;random motion vector 摘要:已有的快速搜索算法中,绝大多数都不检查搜索区中所有候选项,所以,当视频序列中有快速或随机运动时,这些算法常 导致搜索陷入局部最优。为了解决这一问题,提出了一种估算当前搜索点和最佳点之间的距离的度量方法,在此基础上提出了一 种新的自适应的阂值方案,并结合层次搜索技术,既有效提高了具有快速或随机运动的视频的运动估计的搜索速度,也保证了算 法较好的PSNR性能。 关键词:快速运动估计;距离预测;分层搜索;随机MV 文章编号:1002—8331(2007)30—0083—02 文献标识码:A 中图分类号:TP301.6 1引言 的方案,并阐述了一个基于该估算距离提出的终止搜索的自适 在视频编码技术中,已推出了许多基于块匹配(BMA)的快 应阈值技术,在此基础上设计随机MV搜索方案,最后是该运 速运动估计算法,如TSS、BBGDS、DS、HEXBS、CDS、MVFAST 动估计算法的描述。 和PMVFAST等。在快速搜索算法中,搜索模式的形状、大小及 2.1距离估算方案 初始搜索中心的选择等因素对搜索速度及PSNR性能均有很 为了简化距离估算,先做如下假设:假设为一维运动;假设 大影响,所以,各种搜索算法均针对影响搜索性能的因素对算 在前一帧和当前帧之问只有平移运动;假设一个块内所有的像 法进行优化,此外,MVFAST及PMVFAST还通过引入阈值技 素都进行相同的运动;假设前一帧的像素能通过对当前块的像 术以提早终止搜索来减少计算量。然而,绝大多数快速搜索算 素进行线性插值得以重构。 法都不检查搜索区的所有候选项,所以,当视频序列中有快速 图l显示了当前块的像素C( )在前一帧的匹配像素位置 或随机运动时,以上算法常导致搜索陷入局部最优,它们的 P(i ̄m—d),m和d分别代表整像素MV和亚像素MV。所以(m— PSNR性能比FSBMA或分层方法的PSNR性能要低,后者是通 d)是当前块的真实的MV,相应的实心点代表前一帧中精确匹 过牺牲搜索速度来检查整个搜索区。 配的点。从图1可以得到下列关系式: 本文提出的基于距离预测的快速自适应运动估计算法 p( +,n)=c( )(1-d)+c(i+1)d,i∈block (1) (FABDP),通过在当前搜索点与最佳点之间定义一个距离,并 在整像素运动估计中,MV的最小绝对值误差和SAD值计 结合层次搜索技术,根据估算的距离自动选择相应的搜索策略 或是中断搜索,比已有的基于梯度下降搜索算法更适合于那些 具有快速或随机运动的视频序列。 2 FABDP算法 在本章,先介绍一个用于估算搜索点和最佳点之间的距离 图1 当前块的像素在前一帧的匹配位置 金项H:湖南省自然科学基金(the Natural Science Foundation of Hunan Province of China under Grant No.05JJ40006)。 作者简介:谭琳(1970一),女,副教授,主研方向:视频压缩技术、数据库技术;李丽娟,教授。 维普资讯 http://www.cqvip.com 84 2007.43(30) Compu ̄r Engineering and Applications计算机工程与应用 基于以上思想,判断是否随机运动的过程如下: (1)计算随机运动的阈值sAD ,此处,SADm.x=MAX (2) (sAD l,sAD 2,sAD肺帕,sA ),sAD l,sAD 2和sA 分 算方法如下: SAD(m)=∑Ip(i+m)一c( )I iEblock 由式(1)和式(2),得到: 别代表当前块的左、上和右上邻块的最小SAD值,sA 是前一 帧中相同位置的块的最小SAD值。 (3) SAD(m)=d∑ +1)-c( ) 令SADNP=∑Ic(i+1)-c(i)l,即为相邻像素间的绝对值 误差和,则,距离估算为: (2) ̄lJ用小菱形搜索模式计算得到运动矢量,再由此运动 矢量计算得到当前块的SAD值(记为sAD )。 (3)若sAD sAD ,可认为存在随机运动。 2.3.2随机MV搜索 为了高效地执行随机运动矢量搜索,采用了分层搜索方 d:—SAD(m) (4) SADNP 案。图像的第0层是原图,第1层采用了子采样 (i√) ^(4i, 应该注意的是:只有当前搜索点和最佳MV之间的距离小 4j),故在该层,搜索区缩小为原图的1/16。 于1个像素时式(4)才有效。然而,如果假定SAD值从最佳MV 随机MV搜索的步骤为:先在第1层基于FSBMA获得具 处开始单调递增,则当估算的距离d大于1时,此时d虽然并 有最小SAD的第1层最佳点;再将第1层最佳点作为第0层 没有实际的数量上的含义,但仍然可由d得知,当前搜索点与 的初始搜索中心,然后,在初始中心的周围采用SDSP进行局 最佳点的距离大于1个像素。 部搜索,以找到随机MV;如果由随机MV搜索得到的最小 因视频编码中的运动估计是在二维空间进行,以上的推理 ASD比sAD 小,相应的MV将是当前块的最终MV。 应扩展到二维情况。在二维空间,当前搜索点和最佳点之间的 因为新的初始搜索中心是通过检测第1层的所有搜索点 距离表达为( , ),水平SADNP和垂直SADNP计算方法如下: 才得到的,它应该接近全局最小,所以,在第0层通过SDSP搜 索就够了。 SADNPx= Ic(i+1√)_c(i√)I (iJ)Eblock 因为只有当sAp 比sAD 大才在简化的图像中执行 (5) 随机MV搜索,而大多数情况下sAD 比sAD 小,这种求 SADNPr= Ic(i 1)-c(ij)l 精的过程很少执行;且简化的图像只是原始图像的1/16,所以 Cio')Eblock 此处,c( )表示当前块的—个像素,则距离的每—个分量 随机MV搜索的计算量与总的计算量相比并不突出。 可分别预测如下: 2.4 FABDP算法描述 FABDP算法是基于以上的距离估算方案,自适应阈值技 Ⅱ =—SADNP—! .Ⅱ —。 x SADNPr——— ! (6)0 术和随机MV搜索技术,并结合了PMVFAST的阈值技术而提 此处,(m,n)代表当前搜索点。按照式(6),若 或 为0, 出的。其具体算法描述如下: SAD(m,n)也应为0。然而,即使 或 为0,或当前搜索点的 先利用当前块的左、上和右上块的MV预测MV ,如果 或Y分量与最佳点的相应分量匹配,如果当前搜索点的Y或 Mv 处的SAD比 1小,搜索终止;否则,将检测(0,0)点、 分量与最佳点不匹配,SAD(m,n)也可能不为0。所以,预测的 左、上和右上块的SAD,且将最小SAD的点作为Mv 。如果 或 可能比实际的距离要大。 MV 的SAD比 小,MV 就被当作最终的MV,搜索终止。 2.2自适应阈值技术 否则,将利用式(6)来预测M‰和MV~之间的距离( , 在.PMVFAST中提出了一种自适应的阈值技术,即当前块 )。如果 和 都小于1,2像素,搜索终止。如果只有 或 的阈值由三个相邻块(左,上和右上块)的最小SAD值共同决 小于1/2像素,就沿Y或 方向进行一维搜索,直到找到该分 定,从而使之能有效地终止—个有快速运动或随机运动的序列 量才终止搜索。只有当 和 均大于1,2像素,才利用分层搜 的搜索。然而,应该注意到,阈值只考虑到了相邻块的SAD值, 索和 SDSP进行随机MV搜索。 而没有考虑当前块自己的特征,如果当前块与其相邻块的特征 不同,不适当的阈值可能引起PSNR退化或限制其加速性能。 3实验结果 为了解决这一问题,基于前一小节的估算距离提出了一种 本文的实验采用了J、,T的JM8.1作为实验平台,采用了 新的自适应的阈值方案。在该方案中,该位置的 和 由式 Carphone(CP)和Foreman(FM)两个视频序列的CIF格式, (5)和式(6)预测。那么,如果 或 小于1,2像素,认为当前 Football(FB)和Table Tennis(Tr)两个视频序列的SIF格式, 搜索点的 或Y分量与有整数精确度的最佳点的 或Y分量 Foreman和Table tennis两个视频序列的QCIF格式(176x144)。 相同,则不再沿 或Y方向搜索。所以,如果 和 均小于1/2 每个视频序列包含100帧,帧率为30 Hz。实验中,块大小设为 像素,搜索终止,当前搜索点成为最后的整像素MV。然而,如 16x16,搜索范围设为+15,n和 分别设为512和768。 、果只有 或 小于1,2像素,就沿Y或 方向进行一维搜索, 表1中给出了各种运动估计算法的平均PSNR性能比较, 直到找到该分量才终止搜索。如果 和 均大于1,2个像素, 表2给出了各种算法每一块中平均搜索点数(包括了阈值过程 基于搜索范围进行下—步搜索。 和随机MV搜索在内的所有计算)的比较。FABDP算法中使用 2-3基于分层搜索的随机MV搜索 的I圜值 1和 是在搜索速度和PSNR之间进行平衡而设置 2.3.1随机运动的判断 的,通过调整阈值,该算法可以通过牺牲PSNR性能达到更高 因为相邻块总是高度相关,预期中当前块的SAD值会与其 的加速比,或者通过降低加速比提高其PSNR性能。该结果表 相邻块的SAD值相似,如果差异较大,则可认为存在随饥运动。 明,在对照的搜索算法中,FABDP算法需要的平均搜索点数最 (下转166页) 维普资讯 http://www.cqvip.com 166 2007,43(30) Computer Engineering and Applications计算机工程与应用 ference 2003,Hyatt Regency Crystal City,Arlington,VA,USA, 20o3. 的基础上,以适当降低所采集的虹膜图像质量为代价,实现采 集失败率和注册失败率的大幅降低;然后在虹膜识别的决策层 引入对应脸像特征模板的相似度,以补充因为虹膜图像质量的 降低而损失的生物特征信息;最后利用数据融合的方法,根据 虹膜特征模板的汉明距和脸像特征模板的相似度的实际分布 特性,建立各自的隶属度函数,在识别的决策层,提出了一种基 【7】Zadeh L A.Fuzzy sets[J].Information and Controls,1965,8:338-353. 【8】Zadeh L A.Fuzzy sets as a basis for a theory of possibility【JJ. Fuzzy Sets and Systems,1978,1:3-28. 【9】Pao Y H.Adaptive pattern recognition and neural networks[M].IS.1.】: Addison-Wesley Publishing Company Inc,1989. 于隶属度函数的塔式分层融合决策识别的算法。实验结果表 【l0】Valet L,Mauris G,Bolon P.A statistical overview of recent litera— 明,这种方法能够有效地提升识别算法的性能,使得在大幅降 ture in information fusion【JJ.IEEE AESS System Magazine,2001: 低虹膜的采集失败率和注册失败率的同时,识别算法的整体性 7一l4. 能依然能够保持目前虹膜识别技术的高准确率。 【11】Dubois D,Prade H.Fuzzy and systems:theory and applications[M]. (收稿日期:2007年2月) New York:Academic Press,1980. 【12】Kandel A.Fuzzy techniques in pattern recognition【M】.New York: 参考文献: Willey Interscience,1982. 【1】Duncan Campbel1.The importance of biometircs in the U.S.govern- 【13】Kandel A.Fuzzy mathematical techniques with applications【M】. Reading,MA:Addison-Wesley,1986. ment’s response to 91 1[C]//Pmceeding of Biometircs Consortium Con— ference 2005,Hyatt Regency Crystal City,Arlington,VA,USA,2005. 【14】Mandani E H,Gaines B R.Fuzzy reasoning and its applications[M]. New York:Academic Press,1981. 【2】Higgins P T.An introduction of biometircs【C]HProceedings of Bio— 【15】Zimmerman H J.Fuzzy set theory and its applications[M].Hing— metircs Consortium Conference 2005,Hyatt Regency Crystla City, ham,MA:Kluwer Nijhoff,1984. Arlington,VA,USA,2005. 【16】Viola P,John M.Robust real—time object detection[C]//Second In— 【3】Jain A K,Pankanti S,Prabhakar S,et a1.Biometircs:a grand chal— ternational Workshop on Statistical and Computational Theories of lenge[C ̄/Proceedings of International Conference on Pattern Recog— Vision—modeling,Learning,Computer and Sampling,2001,7(13): nition,Cambridge,UK,Aug 2004. l-25. 【4】Ye Xue-yi.Iirs and face based multi.biometrics identiifcation and 【17】Daugman J.Iris recognition border crossing system in the UAE[J]. fusion algorithm[DJ.University of Science and Technology of China, International Airport Review,2004(2). 2006. 【1 8】Daugman J.Biometric personal identiifcation system based on iirs 【5】Daugnmn J.How iirs recognition works .IEEE Trnasactions on Cir— analysis,5291560[P】,1994. cuits and Systems for Video Technology,2004,14(1). 【19】Daugman J.High confidence visual recognition of persons by a 【6】Mahlmeister U.Countermeasure performance evaluation for iirs test of statistical independence【JJ.IEEE Trans Pattern Analysis recognition systems[C]//Proceedings of Biometircs Consortium Con— and Machine Intelligence,1993,15:1148~1161. (上接84页) 之间的距离的方法,提出了一种判断是否存在随机运动的方 表1各种算法PSNR性能比较 法,还提出了一种只有在存在快速或随机MV时才执行的分层 搜索方案。虽然由此会增加一些额外的计算量,但因为快速或 随机MV在视频序列中并不常见,并且,正确地估计距离也提 高了终止搜索的性能,从而也提高了整个搜索速度,所以,这额 外增加的用于分层搜索的计算量可不予考虑。实验结果表明, 新的算法比已有的基于GDS算法速度更快,并提供了更好的 PSNR性能,特别是当视频序列中存在快速或随机MV时。 表2各种算法每一块中平均搜索点数比较 (收稿日期:2007年3月) 参考文献: 【l】Lee Yun-gu,Ra J B.Fast motion estimation robust to random no— tions based on a distance prediction[J].IEEE Trans Circuits Syst Video Technol,2006,16(7):869—875. , 【2】Ahmad I,Zheng Wei-guo,Luo Jian-cong,et a1.A fsat adaptive In0.- tion estimation algorithm【JJ.IEEE Trans Circuits Syst Video Tech— 少,且其总体PSNR性能最好。更重要的是,FABDP算法较好 nol,2006,16(3):420-438. 地提高了Table Tennis和Football视频序列的PSNR性能,这 【3】向友君,郭宝龙.一种快速多分辨率运动估计算法 .中国图象图形 是因为其高效的随机MV搜索。 学报,20o3(特刊):530—533. 【4】喜超,姜昱明.一种用于H.264的快速运动估计算法 .计算机工程 与应用,2006,42(17’):157—159. 4结束语 【5】Joint Video Team(JVT)Test Model,JM8.1【EB/OL].[2006一ll】.http:// 本文提出了一种在搜索过程中估计当前搜索点和最佳点 bs.hhi.de/一suehring/tml/download/.
因篇幅问题不能全部显示,请点此查看更多更全内容