处理器为日益视觉化的世界提供复杂的图形支持
投稿人:电子产品
2014-04-10
如今只是传送纯文本是远远不够的。 要在一个充满极度感官刺激的世界中吸引我们并让我们保持注意力,任何数据都必须按照我们的审美观去呈现。 因此,即便是基本的信息也必须以生动的色彩去展示,还要配上复杂的渐变、动画和视频。
然而,高清晰度、深色板、实时动画和视频都需要有个处理器才能构建、渲染和显示。 我们希望看到的是简洁、明亮和自然的页面。 但是,随着显示器分辨率提高,每页的内容、后台处理和数据移动的量也将提升,为渲染这些变化和内容,占用的处理器资源,特别是对时间和存储器空间的需求也越来越多。
本文将讨论具有足够动力、资源和架构优化能力,能够支持高端图形处理的高端处理器。 这些处理器一般均采用 32 位或更宽的内部数据路径,并使用高速时钟。 内部高速缓存 RAM 以及交叉存取的 DMA 也同样的重要。 本文件所引用的所有零件、规格书、指南和开发套件均可以在 DigiKey 网站找到。
需求和选择
我们中的大多数人都不会那么幸运,设计的产品能够被成千上万地去生产。 因此,ASIC 在成本、时间或风险方面通常都不是有效的选择,我们只能选择可以在处理图形的同时仍可执行其它系统功能的高成本 FPGA。
现在视频成为了一个关键的任务。 数据格式化、子画面裁决、图层叠置以及画面滚动、色彩混合等等,均涉及密集的处理和数据路径任务。 三维 (3D) 渲染与渐变增加了另一个层面的功能预期,这将耗尽处理器的资源和时间。
尽管有些高性能处理器可以编程为专用的图形外设处理器,但一般仍可以处理许多其它任务。 而且,高端外设可能还包含预定的电容触摸接口,以及立体声、以太网和其它通信协议,以便使对应用处理器的中断次数降到最少。 这几乎有点像是有一个另外的内核。 高性能 DMA 和外部总线接口逻辑如很多通用输入/输出一样是普遍存在的。
典型的平板电脑的 TFT 显示屏一般可以有 1024 x 600 到 2560 x 1600 的像素。 如此宽的范围对系统性能造成严重制约,尤其是对所需的存储器资源量(表 1)。 象 Samsung Galaxy、Amazon Kindle 和 Toshiba 平板电脑中所使用的 24 位全彩 2560 x 1600 显示屏,单个页面即消耗 12 M 的 RAM。
表 1: 一般平板电脑显示屏的单页信息存储器消耗对比。
既使有 32 位宽的数据总线,但一次完整的每秒 30 帧的视频流重绘仍发生 368,640,000 单周期 24 位存储器数据传送。 即 2.7 ns 传送一次 ,这对于一次数据渲染和移动处理来说要求太高。 即使您未执行象 MPEG 这样压缩视频格式的实时解码,渲染也是不象您所想像的那样简单。
另一个因素是内部高速缓存 RAM 和外部总线接口速度。 在高时钟速度下,外部总线 RAM 总是处于等待状态,将使处理器负荷严重不足,从而造成性能下降。 好的 SDRAM 接口对于处理器处部总线接口来说,意味着页面可以在后台刷新,让处理器集中整个内核进行渲染处理。
高性能处理器可以专用于图形控制,特别是在它可以快速移进和移出数据时。 在 Freescale MPC8245LVV333D 中可以找到一个实现得较好的高速 SDRAM 接口实例,该器件位于该公司的 Power PC MPC603e 内核的中心,是 MPC82xx 系列的一部分。 这款 32 位、352 引脚处理器时钟速度为 333 MHz,某些系列速度可能更快。 该处理器提供 2、1.8 和 1.5 V 版本,有助于减少这款有着四百五十万个晶体管的器件的功耗。
MPC8245 采用 Power PC 架构和 PCI 桥接器,因此设计师可以使用为 PCI 和其它标准接口设计的外设快速进行系统设计。 其内核可以工作在各种不同的频率下,让设计师灵活权衡性能与功耗。 SDRAM 同步与驱动均由外设控制单元进行独立处理,同时交叉将 DMA 功能释放给外部总线接口逻辑,让显示屏自主实现高速数据传送,从而释放出处理器资源进行后台渲染(图 1)。
图 1: 配有先进的高速外部存储器接口的流水化处理器块就是一个好的专用图形处理器,可以充当高端半自主外设。 这可以满足某些应用的全部需要。
注意 SDRAM 接口支持多达 2 G 的 SDRAM。 高带宽总线可以使用 32 或 64 位传送周期。 集成 DMA 控制器允许离散收集操作,支持自动连接 DMA 缓冲的 DMA 链接。 这样就又减少了主微处理器的一项任务。
Texas Instruments 是一家资深开发商和数字成像和图开领域的行业先锋企业,拥有 OMAP35x 这样的旗舰级处理器及相关工具。 OMAP 平台集合了强大的 600 MHz 超级 ARM® Cortex™-A8 内核,集成四个 OMAP 应用处理器。
特别要说明的是 OMAP3530,据称拥有一流的视频、图像和图形处理能力,为流视频、2D/3D 手机游戏和视频捕捉提供直接支持。 OMAP3530 包含一个图形加速器和专用的视频输入和视频输出端口。
尤其值得注意的是 64 通道 DMA 支持以及低功耗 DDR 接口。 与其它处理器一样,RAM 占去了大部分的芯片区域,在这种情况下,64K 通用 RAM 一般一次会占用一条或两条扫描线。 同样有帮助的是,提供多达 256K 的片载二级缓冲 RAM,这样可以保留模板和某些后台图形信息。 另外,我们可以注意到有另一个 96 K 的 RAM 用于 DSP 渲染和使用。 3530 中也包括了一个基于硬件的图形加速器。
TI 和第三方开发工具制造商均支持这些部件。 Circuitco Electronic 提供的 BeagleBoard 就支持 OMAP3530,并展示了到 SDRAM、S-Video 和 DVI-D 接口以及所有 LCD 接口信号的连接(图 2)。 DigiKey 在线提供 BeagleBoard 产品培训模块以及视频,说明如何使用运行 Linux 的 BeagleBoards 来驱动微型投影仪。BeagleBoard 可能就是一个您很感兴趣的视频接口。
图 2: BeagleBoard 采用 OMAP 处理器架构并可用作强大的测试和开发平台,对嵌入式 Linux 设计来说尤其有用。 它非常适合用于显示器驱动和微型投影仪。
逻辑 PD 使得 SOMOMAP3530-11-1782JFIR 成为一个支持 OMAP3530 的开发和评估平台,并集合了 ARM Cortex-M8 处理器和一个 TMS320C64x DSP 处理器。 尽管该器件主要是针对信号处理开发而设计,但也可是一个可使用的平台开发工具。
多核替代
多核处理器芯片可以是多处理器板的最好的替代手段。 尽管在分享同一存储器和外设总线时可能有些带宽限制,但是如果任务能够以分段方式有效执行,多核处理器仍具有其突出之处。
Freescale 就拥有一款有名的支持多核技术的芯片,即其功能强大的基于 ARM 8 到 ARM 11 的 i.MX 6 系列处理器,支持多达四个 1.2 GHz 的四核器件,带有 64 位 DDR 3 和两个 32 位 DDR 2 接口。
Freescale i.MX6sololite 器件适用于 2D 和 3D 图形芯片 MCIMX6L3DVN10AA,是一个 432 引脚的无 ROM 处理器,采用单一的 1 GHz 内核。 值得注意的是其 256 K 的 RAM 和运行电压低至 0.95 V 的电源。
这些器件灵活性高,可提供多媒体和图形处理功能。 有专用的硬件图形加速器块执行矢量、2D 和 3D 图形处理,从而将处理器从这些数据密集型工作中解放出来。 另一个用于图像处理的专用块可用来处理增加、倒置、旋转、滚动、重新调整大小和混合操作等功能。 此外,还有一个专用硬件块连接相机和显示屏(图 3)。
图 3: 当细分的专用硬件块能够利用高速总线和深存储池时,就可能实现最佳性能。 这可以通过更多集成外设以低成本的方式提供类似 ASIC 级的性能。
Freescale 较大款 624 引脚 MCIMX6S5DVM10AB 也是一种无 ROM 设计,带有专用图形硬件和 ARM Cortex-A9。 双通道和四核处于食物链较高端,并消化掉只是单内核无法实时处理的功能。 例如 i.MX6 系列也包括四核 1.2 GHz 器件,如 MCIMX6Q5EYM10AC。 这些器件也具有双 2D 图形引擎,并通过四个附加着色器提供 3D 支持。
总而言之,尽管 ASIC 可能是提供复杂图形和视频处理的有效解决方案,但是大多数设计师可能付不起成本或花得起时间来使用。 幸运的是,如本文所述,有各种各样好的高端处理器能够提供流畅的视频处理和完成此类工作的功能。
如需详细了解关于本文所讨论的零件,请使用文中的链接访问 DigiKey 网站上的产品信息页。
免责声明:各个作者和/或论坛参与者在本网站发表的观点、看法和意见不代表 DigiKey 的观点、看法和意见,也不代表 DigiKey 官方政策。