您的当前位置:首页正文

基于嵌入式移动GPU的图像编解码并行优化

2020-07-22 来源:钮旅网
基于嵌入式移动GPU的图像编解码并行优化

ARM Cortex-A15系列处理器是当前最新的嵌入式ARM SoC,该系列处理器首次集成了Mali-T600系列的移动GPU,该系列GPU率先支持OpenCL计算框架,可以利用GPGPU (General-Purpose computation on GPU)技术有效加速通用计算,其特殊的异构多核结构为多媒体处理,尤其是图像编解码和数字图像处理等应用提供了并行加速的旷阔空间。近年来,随着移动互联网的快速发展以及智能移动终端的快速普及,以视频编解码技术为核心的移动视频类应用得到广泛应用,传统的嵌入式平台上依赖于CPU的串行计算的方案已经难以处理这类大数据量的计算密集型问题,GPGPU并行加速技术在硬件成本和功耗严格限制的ARM嵌入式平台上具有重要的应用价值。

当前国内外对于移动GPU的GPGPU技术的应用研究较少,尤其是缺乏实际的应用实例和方法总结,因此本文基于Mali-T604嵌入式移动GPU深入研究了GPGPU技术在ARM嵌入式平台的应用方法,主要包括移动GPU的硬件结构,并行计算模型、编程方法等,并针对LibJpeg (Jpeg Codec官方实现)以及Xvid(公认的Mepg4 Codec优秀实现)两个开源项目对Jpeg静态图像解码算法和Mpeg4动态图像编码算法基于Mali-T604 GPU的GPGPU技术和ARM Neon多媒体指令集进行并行优化,主要包含离散余弦变换、像素内插、运动估计、运动补偿、色彩空间转换等计算密集型功能模块的并行化,最后完成了优化效果的实际测试,并对优化结果进行了分析和总结。本文采用的硬件测试平台是Arndale Board开发板,该平台以三星的Exynos5250处理器为核心,搭载了Mali-T604移动GPU,软件平台采用Linaro机构为Arndale Board定制的基于Ubuntu的嵌入式Linux操作系统,其内核版本为3.10.37。

对不同分辨率和不同内容的视频序列的测试结果表明,不论是针对静态图像还是动态图像,Mali GPU的并行加速能力均能提供可观的加速比,尤其是针对高分辨率的图像编解码,加速比达到4倍左右,证明嵌入式GPU的GPGPU技术对于多媒体应用的加速有效而显著。

因篇幅问题不能全部显示,请点此查看更多更全内容