有什么中国移动appGPU是支持ETC2的呢

可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题

百度知道合伙人官方认证企业

三星产品使用咨询服务支持

GPU又名为图形处理器,是顯卡的心脏主要处理与图形有关的任务,用于色彩渲染图面、纹理填充率用于贴图、游戏等

你对这个回答的评价是?

《》一文中我们把2012年的中国移动app處理器的厂商做了一番介绍并按照各自的属性给划分了门派。既然把他们称为江湖门派那么每一个门派总要有自己的绝活。中国移动app處理器厂商中CPU基本都是源自ARM同架构下各家厂商的表现都差不多,能成为镇派之宝的绝学都是在GPU上近日奉上续作,对五大中国移动appGPU厂商進行了逐一点评——

做能中国移动app处理器的厂商可以洋洋洒洒列出几十家我们精挑细选了近年出过风头的依然有13家,但是说到设计GPU核心这个名单就短多了,主要的厂商甚至不到5家


2012年的中国移动appGPU份额调查

作为中国移动app处理器的后续篇章,今天我们就来介绍一下中国移动app處理器中GPU厂商的情况我们只选了5家我们平时接触到相关产品的厂商——Imagination、高通、ARM、NVIDIA、Vivante。DMP和Takumi虽然份额不比ARM低但是我们身边还真没多少处悝器使用他们的GPU方案。

机是一样的机GPU上见高低。

中国移动appGPU的影响实例:不同机型画质大不同

在水果与机器人的战争中iOS阵营的应用软件忣游戏表现的很统一,特别是在游戏方面iPad mini这样的规格精简版表现普遍都会好于Android版,Android阵营中高帅富机型与DS机型齐飞同一个游戏在不同机型上的表现环肥燕瘦,各不相同


《史诗城堡》benchmark中不同机型画质不一

以之前测过的一款名为《史诗城堡》的benchmark为例,它在高通、NVIDIA、PowerVR、Mali等GPU上的畫质表现差异很大有的地面纹理很清晰,有的就直接很模糊锯齿严重。

这个问题既不是第一次被发现也不是第一次有解释。很多玩镓都已经知道了造成这种画质差别的主要原因是游戏的纹理数据不一样,再深入一点就是游戏开发商针对每个处理器平台的特点使用了鈈一样的纹理压缩格式那些重点照顾的GPU的游戏画面会很漂亮,之外的GPU有可能会存在各种问题

由于中国移动appGPU的性能弱、带宽低(下文还有解释),游戏模型的纹理不可能很精细至少不能跟桌面GPU相比(手机的小屏幕、高PPI已经帮着遮羞不少了),在带宽有限的情况下哪种纹理压缩格式压缩比更高、画质损失最小就成了关键游戏开发商选择支持哪种纹理压缩格式就带来了画质上的不同。

目前五大GPU厂商中每家的中国移動appGPU产品至少都会支持一种通用的纹理压缩格式有的还支持自己的独家纹理压缩技术,简单来看一下

首先说OpenGL ES标准中的,2.0版规范中将ETC(Ericsson Texture Compression)作为基本的纹理压缩标准这是大部分中国移动appGPU都会支持的纹理标准。OpenGL ES 3.0中还引入了ETC2、EAC纹理压缩格式二者基本一致,只不过EAC主要用于1-2通道数据嘚情况目前ECT2还在改进中,除了高通的Adreno 320之外还没有中国移动appGPU支持Tgera 4也不行。

说到S3TC之前苹果和HTC大打专利战的时候就涉及到了这个标准。S3已經归为VIA威盛旗下HTC和威盛又有同一个老板——王雪红。为了支援HTC打专利战威盛去年就把S3部门出售给了HTC,算是左手倒右手吧

目前来说我們能常用到的纹理压缩主要是ETC、PVRTC、S3TC、ATITC这四种种。

主流紋理压缩格式优缺点

先来看压缩比如果无失真的PNG容量是5.4MB,那么S3TC和ETC都能压缩到1.1MBPVRTC压缩朂高,可压缩到528KB不过PVRTC的问题在于它只支持PowerVR系列GPU,有排他性高通的Adreno支持的ATITC同样有排他性,其他厂商并不支持

ETC是最通用的纹理压缩格式,不过ETC并不招厂商待见因为ETC纹理压缩不支持Alpha通道,只能用于压缩不透明的材质不过ETC也有自己的优点,几乎所有的安卓设备都可以支持ETC壓缩的GPU加速

S3TC无论压缩速度还是压缩比都不错,也支持GPU加速而且是桌面显卡通用的压缩格式,看起来是最完美的选择可惜的是中国移動app市场跟PC不一样,大家各自为王NVIDIA现在还没强大到让其他GPU厂商低头采用S3TC标准的程度,因为S3TC说到底还是一种私有的标准有专利上的麻烦。

ETC2壓缩标准补全了ETC1不支持Alpha通道的缺陷支持更高质量的RGBA(RGB+Alpha)压缩,而ARM提出的ASTC标准在压缩速度和质量上比S3TC要好但是这两种压缩格式都是新出的,支持的厂商实在太少了

中国移动appGPU相对桌面级的GPU只能算是未长大的小孩子。虽然小孩子在某些场合也能比成人更有优势(比如杂技、柔术之類的表演)但在力量上还是有先天的差别,主要表现在理论性能和带宽上

与桌面GPU动辄256-bit甚至384-bit的位宽、1.2-1.5GHz的高频显存相比,中国移动appGPU不仅要和CPU囲享内存带宽而且普遍使用的是双32-bit位宽、LPDDR2-800或1066左右的内存系统,总带宽普遍在10GB/s以内悲催的Tegra 3使用的还是单通道内存模式,搭配DDR3L的带宽不过6.4GB/s

中国移动app处理器中内存带宽最高的是iPad 3/4,因为他们使用Retina屏幕的高分辨率对GPU带宽要求更高,不过就算是这两款产品17GB/s的带宽与PC显卡上动辄200GB/s鉯上的带宽相比还是小儿科了。

没有高带宽就没有大容量纹理数据也就不会有高画质。尽管带宽不是制约中国移动appGPU发展的唯一因素但昰在目前的限制下,中国移动appGPU厂商关心的头等大事就是如何在尽可能小的带宽需求下提升GPU性能及画质前面介绍的纹理压缩是一个方法,還有一种就是使用不同的渲染方式主要有IMR、TBR及TBDR等。

伤不起的“立即渲染模式”——IMR

IMR(Immediate Mode Rendering)就如字面意思一样——提交的每个渲染要求都会立即開始这是一种简单而又粗暴的思路,优点缺点都非常明显如果不用为性能担忧,这种方式会很省事但是IMR的渲染实行的是无差别对待,那些遮蔽处理的部分依然会被渲染处理器这也导致无意义的读写操作更多,浪费了大量性能和带宽

总之,IMR这种渲染方式在中国移动appGPU仩的评价只能是“负分滚粗!”

变聪明了的“贴图渲染”——TBR

IMR傻大粗的做法不可取,那就来一个聪明点的方式——TBR(Tile Based Rendering贴图渲染)。它将需偠渲染的画面分成一个个的区块(tile)每个区块的坐标通过中间缓冲器以列表形式保存在系统内存中。这种渲染方式的好处就是相对IMR减少了不必要的渲染任务缺点就是遮蔽碎片依然会少量存在,而且需要中间缓冲器


TBR渲染将游戏画面分为不同的区块

再次进化的渲染方式登场——TBDR

Removal,隐藏面消除)等进一步减少了不需要渲染的过程降低了带宽需求。实际上这些改变和PC上的渲染有些相似


TBDR渲染的一个关键是延迟渲染

TBDR主要是Imagination在使用,这是他们最大的筹码之一其他几家厂商用的都是TBR技术。

在微软的DX11.1升级中也有提到支持TBDR因为Windows 8系统还专门为平板和触控优囮,对TBDR这种中国移动app平台常用的技术加以优化也是必然的

Imagination技术公司并不介入ARM处理器生产,他们专注于是中国移动appGPU技术授权因为专业所鉯强大,Imagination绝对是中国移动app平台GPU授权的老大即便是Intel的Atom处理器及桌面的GMA 500也使用了PwerVR系列GPU核心。他们的触角伸得很广并不局限于ARM阵营。

Imagination也是一镓英国公司早前还有个部门VideoLogic。在3D加速卡方兴未艾的那个年代VideoLogic也曾参与了Voodoo、NVIDIA、ATI等公司激战3D加速卡的战役,可惜最终存活的只有NVIDIA和ATI(AMD)不过夨之东隅收之桑榆,Imagination的中国移动appGPU技术部门PwerVR反倒有所收获在中国移动app市场上他们又可以俯视NVIDIA了。

Imagination公司的授权伙伴主要有Intel、苹果、联发科、LG、高通、瑞萨、三星、海思、Marvell、索尼等等几乎都是大腕,其中Intel和苹果还是Imagination公司的大股东之一

近年来Imagination公司也不再满足于中国移动appGPU技术授權了。去年底以1亿美元的代价收购了MIPS公司的专利和资产已经把MIPS架构融入到自家Mtera处理器中了。CES展会上Caustic公司展出了Caustic 光线追踪加速卡,而这镓公司也被Imagination收购了看来他们的业务范围还在扩大。

图形规范方面PowerVR SGX 5XT依然支持OpenGL ES 2.0/1.1、DX9,不过该系列依然增加了新元素自SGX 544开始支持PVRTC2纹理压缩格式,全系列引入了部分OpenGL ES 3.0中才有的技术比如MRT多目标渲染、遮蔽查询、无缝立方体映射、浮点纹理等新功能。

当然这么高的性能只有PowerVR 6系列嘚的旗舰型号可以达到,从高到低总计有G6630、G6400、G6430、G6200、G6230、G6100等型号其中G6100、G系列专为核心面积优化,适合组成单核、双核或者四核设计

Imagination能成为Φ国移动appGPU的老大显然会有很多独特优势和技术。他们的GPU不是性能最强的也不是核心面积最小的,不过单位功耗性能、单位面积性能表现嘟很强多核集成、配套的开发工具、纹理压缩格式、TBDR渲染技术都是他们冲锋陷阵的利器,综合起来PowerVR就是表现最优秀的中国移动appGPU授权之一

堆砌大篇PowerVR详细架构的文字也没什么意思,其中一个让人感兴趣的问题是PowerVR 5及5XT是否使用了统一渲染架构从找到的资料来看,PowerVR的USSE引擎中第一個U代表的意思在目前的官网上是指Universal通用但是早期的发布新闻上这个U代表的是Unified,也就是统一渲染的意思

5是在2005年宣布的,桌面级的统一渲染架构是2006年发布的这就可以说明Imagination的技术实力是多么强大。

点评与展望:PowerVR 6啥时候上市

对一个占据了绝大多数市场份额的公司也没有继续赞揚的必要了苹果、联发科等大客户的销量就能说明一切。虽然发布了好几年了PowerVR 5/5XT依然是目前追求极致游戏性能的最佳选择之一。

问题是PowerVR 6架构发布及PPT宣传都快一年半了,现在连影子都没PowerVR 6的性能提升很夸张,制程工艺及实际应用都要跟得上才行前几天正好有新闻说Imagination联合囼积电宣布将使用后者的16nm FinFET工艺制造,这一下子就给支到至少2014年了

发布时PowerVR 6已经有6家厂商买了的授权,其中三家是德州仪器、联发科和ST-Ecricsson(意法-愛立信)还有三家没宣布,不过结合之后的消息来看三家没公布名称的厂商至少有海思而LG也在今年的CES展会上首次公布了PowerVR 6平台,说明他们吔在授权内瑞萨也展示过PowerVR 6平台,算起来差不多就是这三家了苹果是否愿意获得PowerVR的授权就不得而知了。

只是时过境迁TI目前退出了消费級嵌入式处理器市场,意法-爱立信也关闭了即便是公开展出的PowerVR 6也全都是大块头,集成到智能手机和平板所用的超低功耗处理器中还很远

江湖富二代——ARM公司的Mali

ARM公司不仅提供ARM处理器授权,他们也有一整套GPU授权方案——Mali由于亲生的血缘关系,Mali在好爸爸ARM的帮助下也攻城掠地很多不具备独立开发GPU技术的芯片供应商都直接使用了ARM处理器+Mali GPU的设计,比如三星、瑞芯微、展讯、意法半导体、全志等其中三星和全志還是出货量大户,所以Mali GPU的份额和出货量可不低

ARM官网显示Mali GPU在智能电视和Android平板中占有率第一,智能手机市场占有率超过20%2012年出货量高达1亿(一說是1.5亿),使用Mali GPU的终端超过200多种

说到Mali的历史,ARM原本也是没有GPU授权的此前他们也是使用Imagination的GPU核心。Mali其实是源于2006年收购的一家挪威特隆赫姆地區的中国移动appGPU芯片厂商FalanxARM公司的Mali GPU开发中心也就落户在哪里,现在Mali已经变成了ARM的亲儿子了

Mali-T600系列是去年才开始露面的新一代产品,支持OpenGL 3.0和DX11规范使用了统一渲染架构,支持OpenCL和DirectCompute加速T600系列实际上也发展了两代了,露面最早的Mali-T604是第一代Mali-T624/628/678等后续产品则是第二代架构了。

ARM没有公布Mali-T604的具体频率及核心面积、性能只说是前代产品的5倍性能。

Mali-T624的规格参数基本与T604一致不过核心升级到了第二代Midgard,T628最多能支持8核配置

昙花一現的Mali-658还是第一代Midgard架构,现在已经被二代Midgard架构的T678取代之前的资料显示T658的性能是Mali-400 MP的10倍,计算性能是后者的4倍Mali-678只会比这个指标更强。

Mali-T600还支持ARM開发的ASTC纹理压缩格式现在已经成为OpenGL ES规范中的一个可选纹理标准,其压缩率更高内存带宽要求更低。

ARM的Mali GPU给人的感觉更像是PC中的公版显卡┅样积极支持各种最新标准,注重性能功耗比以Mali-400 MP4为例,整合256KB L2缓存及内存之后核心面积也只有6.8mm240nm LP工艺及250MHz频率下像素填充率就有1000MPix/s,28nm工艺的Tegra 4嘚GPU核心面积10.5mm2像素填充率为2688MPix/s,但是它的频率高达672MHzMali-400 MP4如果使用同样的工艺和频率的话性能不会比它差,Mali-T600系列号称同样核心面积下IPC性能提高了50%

但是Mali GPU的问题在于目前授权使用的大部分还是Mali-400 MP以下的,Mali-450 MP都没有多少厂商集成Mali-T604除了在三星的Exynos 5250中有过应用,发布过一年多以来未见其他处理器集成即便是三星这个老朋友,新一代的Exynos 5 Octa也改用PowerVR的GPU核心了Mali又少了一个可靠的合作伙伴。

尽管三星的换门会给Mali带来一些短暂的麻烦不過ARM的CPU+GPU一条龙方案对很多实力不足的厂商还是有很强的吸引力,在中低端市场Mali GPU依然有自己的一席之地份额不可小视。

未来的和尚会念经——高通的Adreno

作为屈指可数(不是唯一一个)可以自己改进ARM指令的中国移动app处理器厂商说高通是安卓阵营中国移动app处理器一哥估计没人会反对,洅加上高通的3G技术及基带上的优势高通处理器绝对是近年来最热门的选择之一,顺带着也把高通的Adreno图形核心带火了

跟ARM亲生的儿子Mali差不哆,高通的Adreno其实也是领养的Adreno原本是ATI旗下的中国移动appGPU部门,当时叫做Imageon主要为当时的掌上平台提供图形核心。2006年AMD收购了ATIImageon部分也进入了AMD公司。收购ATI之后AMD就进行了改组Imageon部分很不幸地成为多余资产,最终在2008年末被高通以区区6500万美元的代价买走现在就是高通的Adreno图形部门了。(不知道AMD看到现在的情况是否会后悔)

高通与AMD的纠葛还没有完,去年2月份AMD当时的CTO Eric Demers也低调离职他没有加入NVIDIA或者Intel,最终去了高通公司去负责中国迻动appGPU的发展AMD后来则挖到前苹果副总Mark Papermaster做新任CTO,这也算是AMD对2009年时任CTO加盟苹果的报复吧

220系列的资料也非常少,目前只知道二者的架构基本是┅致的使用了统一渲染架构(高通原话),都是8组渲染管线每组渲染管线中有4个矢量ALU单元和1个标量ALU单元组成,矢量单元可执行4个MAD指令操作不过标量单元不能执行MAD指令,因此每组渲染管线依然是每周期执行4个MAD指令的能力

随着四核APQ8064处理器的上市,高通处理器的GPU目前已经转向叻Adreno 320了骁龙S4的升级版骁龙600集成的也是Adreno 320,不论架构还是性能都比之前的Adreno 22x系列都有明显优势

虽然前面的220/225中高通也说是统一渲染架构,但是Adreno 320才昰高通第一款真正意义上的统一渲染架构的中国移动appGPU支持最新的OpenGL ES 3.0规范,加强了GPGPU通用计算的比重性能比前代Adreno高了3-4倍。即便是目前来说巳上市的四核处理器中APQ8064的图形性能也是拔尖的,除了华为的Ascend D2之外其他5寸1080P手机基本都使用了APQ8064处理器。


CPU和GPU都可以加速游戏性能提升

今年初高通又公布骁龙800处理器与骁龙600继续使用Adreno 320(虽然也会有所改进)不同,骁龙800将使用更新的Adreno 330高通表示Adreno 330的性能是Adreno 320的1.5倍,计算性能则是它的3倍而且會支持Ultra HD标准的4K视频,听着非常诱人不过实际体验还得等相关产品上市再说,也要到下半年了

无论从哪方面看,高通用6500万美元收购AMD旗下嘚中国移动app图形部门都是一笔超划算的买卖Adreno带给高通的收益恐怕是一百个收购额也比不了的。

对高通来说就算不考虑Adreno图形核心的性能洳何,仅凭着高通在CPU和基带上的优势Adreno都能在整个市场上保留一席之地,更何况目前的Adreno 320依然是图形性能最高的中国移动appGPU之一大者恒大还昰有道理的。

在中国移动app处理器这个江湖里NVIDIA算是后起之秀前一篇的中国移动app处理器门派划分中我们将其归为“峨嵋派”,虽然开宗立派時间短但是后来居上,再加上NVIDIA在PC市场的影响力他们虽然是资历最浅的外来户,但在GPU技术上实力雄厚前途无量。

Tegra系列从AP2 2500开始到现在也絀过四代产品了其GPU核心也沿用了GeForce的命名,一般称为GeForce ULP(Ultra-low power)超低功耗之意。第一代的Tegra虽然也曾被微软的Zune HD青睐不过目前来说已经是古董级产品叻,NVIDIA官网也将其除名介绍的只有Tegra 2、Tegra 3和Tegra 4,我们也从他们说起吧

NVIDIA的中国移动app处理器往往是发布最早的,Tegra 2是世界首款双核Cortex-A9架构处理器Tegra 3是首款四核Cortex-A9处理器,Tgera 4则是发布最早的世界首款四核Cortex-A15处理器这也算是Tegra系列的一个前期优点吧。

Tegra 3是我们的老朋友了也是NVIDIA目前的绝对主力,四核Coretx-A9架构GPU中有12个图形单元,分为4个顶点单元8个像素单元,运行频率有416MHz及520MHz两种其中微软Surface RT、Google Nexus 7使用的就是416MHz版本,高端手机和平板中使用的则是520MHz蝂本

Tegra 4现在已经发布,不过还没有具体产品上市只能说是今年下半场的主力。与Tegra 3相比它的架构、工艺都有升级,制程升级到28nm HPL工艺CPU核惢升级为四核Cortex-A15,GPU单元数量则从前代的12个跃升到了72个实际运行频率约为672MHz。

另外还有一个精简版的Tegra 4i制程工艺也是28nm,CPU核心为四核Cortex-A9 r4p1改进版GPU单え减少到60个,不过它整合了LTE基带功耗和发热更适合手机使用。

架构设计:源自NV4x

Anandtech此前针对Tegra 2、3、4的GPU架构做了一番分析Tegra的核心依然是传统的頂点和像素单元分离设计,即便是新一代的Tegra 4也不例外并没有使用统一渲染架构。

Tegra 2有一组顶点和一组像素单元每组各有4个ALU运算单元,Tegra 3的頂点单元不变增加了一组像素单元,变成4+8形式Tegra 4的顶点单元有6组,24个ALU单元像素单元则由4组,每组包含12个ALU单元24+48的形式组成了72个图形单え。

Tegra 4i则在Tegra 4的基础上砍掉了三组顶点单元还剩下12个定点单元,48个像素单元不变总结是60个图形单元,不过砍掉了一半的顶点单元意味着其彡角形生成率会大幅下降

NVIDIA这几代的Tegra处理器的GPU核心架构其实没什么变化,都源于早期的NV4x架构每个ALU单元每周期可执行4个MAD指令,Tegra 4的顶点单元規模是Tegra 3的6倍像素单元管线是Tegra 3的2倍,不过每组管线的规模又是Tegra 3的3倍像素单元的规模总体还是Tegra 3的6倍。

不过Tegra 4的GPU核心也在效能方面做了改进增加了L2纹理缓存,提升了像素渲染的最大寄存器(从16提高到24)等等

另外,Tegra 4的672MHz的运行频率也比Tegra 3的520MHz要高因此理论性能方面的提升如下:

最后,Tegra 4虽嘫不能完整支持OpenGL ES 3.0规范不过其中的大部分技术都是支持的,比如多目标渲染、遮蔽查询等新增技术都有支持

1、坚持小核心战略,单位面積性能取胜

与桌面/专业卡中更追求性能的战略不同NVIDIA在Tegra处理器上反倒谨慎了许多,非常注重控制芯片的核心面积Tegra 4在规格大幅提升的同时依然将核心面积控制在了80mm2左右,其中GPU核心面积只有10.5mm2与竞争对手相比小了许多。


GPU核心面积都被换算到了等效28nm工艺下

这就给NVIDIA带来一个宣传上嘚优势——单位面积性能足以秒杀目前的竞争对手不论是高通的APQ8064还是苹果的A5X、A6X,在这个指标上都被斩落马下

当然了,Tegra 4的绝对性能也不差此前官方公布及现场演示都表明其安兔兔得分高达3.6万左右,比目前的跑分天王APQ8064最高2.1万分的成绩高了50%

2、游戏优化不错,THD专属给力

虽然NVIDIA茬PC平台的游戏优化被AMD的Gaming Evolved慢慢超越但是中国移动app平台是他们的心头肉,跟厂商合作的优化还会继续深入Tegra系列还有专属的THD游戏,专门为NVIDIA的處理器优化

此前的一个例子就是EPIC的《史诗城堡》demo,虽然Tegra 3的理论性能被高通APQ064打个落花流水不过在这个demo测试中Tegra 3的成绩普遍好于APQ8064,更大幅领先三星的Exynos 4412等处理器


没有Tegra 4,你游戏中的妹子都不够靓

Tegra处理器其实还有一个最大的优点那就是相关设备价格比较便宜。以四核Tegra 3为例它已經在两千甚至一千元内的四核手机中有过应用,北斗小辣椒、中兴V985、天语大黄蜂等等其中的代表影驰的999元四核平板使用的也Tegra 3处理器,看來黄总为了出货量也在价格上拼了

说到Tegra处理器的不足,那就是发布早上市晚的惯性了很容易让后来者超越。Tegra 3是最早的四核Cortex-A9但是等到仩市铺货的时候别的厂商的28nm四核都来了,Tegra 3性能上不再有优势了40nm制程的功耗也比别人高。Tegra 4现在也是差不多的情况1月份发布的,平板和手機要想用上Tegra 4恐怕得到下半年甚至年底了

另外一个让人揪心的就是功耗了。Tegra 4迟迟不能应用就多少受到了这方面的影响据分析Tegra 4的TDP功耗高达5W,用在手机和平板中还有很大的难度公平地说,功耗升高是所有四核Cortex-A15处理器都要面对的问题但是谁让Tegra 4最早发布呢,它必然第一个承受這个非议

Tegra 4还没有上市,NVIDIA又在前不久的GTC 2013大会上规划好了Tegra 5以及Tegra 6了与目前的架构相比,后两者的变化可谓革命性的

Tegra 5代号Logan,它将会进入统一渲染时代使用Kepler核心,OpenGL ES规范上一跃升级为OpenGL 4.3同时还支持CUDA on ARM,意味着中国移动app处理器上也能用上CUDA加速了再加上OpengGL 4.3支持,Tegra 5明年有可能成为最先进嘚中国移动appGPU之一

回头来看,随着GPU在中国移动app处理器中分量越来越重要在GPU技术上有先天优势的NVIDIA未来还是值得看好的,目前的Tegra 3和Tegra 4还是小改款但是明年的Tegra 5意义大不同了,超强的技术规范及GPU通用计算的加入有望大幅提升GPU的应用范围这在ARM处理器阵营中可算是蝎子尾巴——独一份了。

性能出众的“小众”产品——Vivante的GCxx

与PowerVR、Mali、Adreno等明星相比Vivante公司的GC系列GPU核心就不太为人熟知了,就连市场份额比它少的Tegra系列都比Vivante知名去姩让Vivante露一大脸的是华为旗下的海思K3V2,这颗号称“世界最快四核”的中国移动app处理器在华为去年的Ascend D1四核、荣耀2四核以及今年初的Ascend

Vivante其实还是挺囿资本的创立于2004年,创始人好像还是个华裔他们专注于中国移动appGPU市场,2010年的时候就有超过40家授权单位主要客户有Marvell、飞思卡尔等,很哆人不知道的是国内的瑞芯微电子的RK2918以及自主知识产权的国产明星“龙芯-2H”使用的也是Vivante的GPU核心

Vivante给人的感觉就是“小众”,好听点的说法昰“Vivante虽然小众但是性能出众”,难听点的说法是“Vivante的GPU性能出众但是市场小众”。只不过从市场统计上看Vivante的GC系列在中国移动appGPU的份额上僅次于PowerVR、Adreno以及Mali之后,2012年上半年的全球份额是9.8%比Tegra的2.5%份额要高得多。

说起来Tegra才是小众他们是大众产品呢,只不过Vivante在消费级的智能手机和平板领域确实露面太少给人的印象是“小众”。

双核GC4000的理论性能可达96GFLOPS核心面积24.8mm2,单纯的数据指标不好理解我们拿它与苹果A5X做个对比,後者使用的PowerVR 554MP4核心理论性能为76.8GFLOPS,GPU核心面积约为36.6mm232nm工艺,这说明双核GC4000在制程工艺落后的情况下核心面积更小但是理论性能更强。

GC系列性能洳此强劲的一个原因还在于它的高频率他们的GPU通常有AHB和AXI两个接口,AHB总线下运行频率为400MHzAXI总线下可达600MHz,这可比A5X的GPU 250MHz的频率高得多

至于未来嘚产品规划,2011年的路线图上就规划了性能更强的GC600和GC800原本预计在2012年Q1季度亮相,使用的工艺甚至会升级到20nm不过目前来看Vivante最成熟最高端的产品还是GC4000,后两者并未见到产品发布及上市

现在来汇总一下Vivante的GC系列GPU核心的一些特点。

1、支持业界标准兼容多种API规范

这一条本来是中国移動appGPU厂商的基本工作,但是鱼龙混杂的市场Vivante对业界标准的支持还是非常好的因为他们本身就是标准制定者Khronos中的成员,对OpenGL ES、OpenCL、OpenVG以DX等规范支持嘚比较好

当然了,Vivante的硬件还要继续升级目前的GC4000还只支持OpenGL ES 2.0,也没有采用统一渲染架构制程工艺也应该升级。

2、最高的性能/面积比

前面嘚规格介绍中就可以看出GC系列GPU的优点是核心面积小理论性能高,二者集合在一起就是Vivante的GPU有着业界最高的单位面积性能

与ARM的Mali、Imagination的PowerVR相比,GC系列的单位面积三角生成率是其他厂商的3倍像素填充率是1.5倍,浮点性能是他们的2.5倍

3、高倍抗锯齿下的低带宽要求

中国移动appGPU开启MSAA抗锯齿の后三角形生成率直线上升,对带宽的要求更高Vivante的GC系列对带宽的要求就没有其他厂商那么高,性能损失也更小

GC系列根据GPU不同负载可分為活动、空闲、待机及睡眠多种状态,可以根据需要实现不同的性能配置整合了先进的频率/功耗门控电路,可以动态开关GPU电路独立的PLL電路还可以实现不同的频率调节,厂商还可以通过软件来调节GPU的功能

Vivante的GC系列GPU还有一个优势前面也提到了,除了支持标准的纹理压缩格式外它还支持S3TC压缩格式,跟Tegra是通用的所以理论上THD游戏在Vivante的GPU上也会有同样的特效。

说完了优点再来看看它的不足Vivante的GC系列GPU号称有着业界最高的单位面积性能,而且双核GC4000的配置在性能上已经秒了iPad4但是实际使用中并没有这么夸张。就算最常见的跑分测试中它的3D性能不仅没达到iPad4嘚高度高通的Adreno 320都要好很多,再算上有些游戏还存在兼容性问题Vivante的GC4000有点名不副实。

造成这个现象的原因主要是GC4000核心在智能手机/平板上应鼡较少开发商优化不足,但是Vivante自己的因素也不可忽视其强大到逆天的理论性能是通过高频率实现的,但是实际使用中为了节能GPU核心頻率通常很很低,游戏中因为功耗和发热的限制也不会全速运行这就形成了强烈的对比——跑分强,游戏性能一般

具体的例子就是华為手机的作弊门。有人解析了华为手机的文件后发现荣耀2四核存在着对主要测试程序的优化跑测试时超频运行。现在看来加压超频的可能并不大更可能的情况是:测试时GPU运行在最高的600MHz频率下(GC4000可支持的最高频率),但是实际使用中频率往往只有200-300MHz左右这种反差带给人的感觉恏像是华为手机在超频运行,是在作弊

总之,Vivante的GC系列GPU核心核心面积小理论性能强大,有着业界最高指标的单位面积性能比但是Vivante的主偠客户并不在智能手机和平板市场上,所以实际应用中优化不够给力跟理论性能有很大差距,而缩小这个差距也不是一天两天就能完成嘚Vivante及华为还得努力。

话说回来期待他们继续优化GPU和应用并不意味着华为及Vivante的产品不好,从华为最近发布的固件升级及用户的反馈来看主流的游戏中K3V2并没有什么问题,大型3D游戏同样玩得转

机是一样的机,GPU上比高低

中国移动app处理器的核心架构有ARM罩着(Intel的X86架构另算)各家厂商在CPU部分基本没什么区别,即便是自行开发架构的高通也会与ARM保持兼容中国移动app处理器从PC的小跟班一跃成为能跟PC抗衡的大产业也多少得益于这种统一。

相比之下中国移动appGPU就有点各自为政的感觉了,某个游戏在不同处理器上不仅有性能高低的区别画质、兼容性等方面还囿三六九等之分,安卓阵营的碎片化不只是Google的问题吧GPU也多多少少做了几分“贡献”。

在列举的五家中国移动appGPU厂商中Imagination目前实力最强、份額最高,不过我们觉得更有危机感的正是他们因为他们是专业的GPU IP授权厂商,自己不生产GPU产品产品应用与否全靠授权合作伙伴的选择,泹是任何一个有远大目标的公司都不会任由自己的产品核心掌控在别人手里Intel和苹果目前已经是Iimagination的大股东了,说不定哪天有兴趣就把它给控股了

Imagination也不介入CPU部分,不过他们实际上也有自己的处理器架构——Meta SoC今年还重金收购了MIPS公司,MIPS架构也在融入Meta处理器中除此之外,Imagination还收購了光线追踪加速卡公司CausticR渲染卡都已经出货,他们也不会鸡蛋都放在PowerVR这一个篮子里

至于ARM和高通,他们的GPU份额不低ARM能提供CPU+GPU一整套方案,高通的CPU+Adreno GPU+基带的组合也是无往不利前途也是光明的。

IP授权公司份额则比后者少得多。我们觉得华为还是出手收购了它吧就算十几亿媄金的价格,华为也能承受得了而且Vivante不是AMD或者Intel、NVIDIA这样的公司,美帝政府的阻力也不大不行就让报纸和央视整高通,理由就是高通的3G专利严重影响了我们的国家安全玩不死他们。

还有就是NVIDIA要说做GPU他们的技术实力是这几家公司中最强的,但是包括目前的Tegra 4在内的GPU架构其实還是相对保守NVIDIA预定明年推出的Tegra 5才更有革命性。Tegra 5的架构会升级到真正的统一渲染架构而且会选择主流的Kepler架构,支持的技术规范也跨代升級到了OpenGL 4.3这是OpenGL ES 3.0的超集,DX11之类的规范应该也能支持

面对比重越来越大的GPU加速,NVIDIA直接把专业市场的CUDA加速带到了ARM平台上这意味着以前很多需偠CPU乃至单独的应用处理器才能进行的任务都可以让GPU来完成,这是所有GPU发展的大趋势之一也是NVIDIA准备的杀器。

如果你也被NVIDIA成功洗脑了那么丅边这句话可以把你拉回现实:虽然中国移动appGPU的性能和技术决定了未来,NVIDIA在这方面有优势但是市场成败的关键还要看厂商的功耗控制,茬目前电池技术龟速前进的情况下没有可靠续航的中国移动app设备都是在耍流氓。

  门派那些事儿》一文中我们紦2012年的中国移动app处理器的厂商做了一番介绍并按照各自的属性给划分了门派。既然把他们称为江湖门派那么每一个门派总要有自己的絕活,中国移动app处理器厂商中CPU基本都是源自ARM同架构下各家厂商的表现都差不多,能成为镇派之宝的绝学都是在GPU上

  做能中国移动app处悝器的厂商可以洋洋洒洒列出几十家,我们精挑细选了近年出过风头的依然有13家但是说到设计GPU核心,这个名单就短多了主要的厂商甚臸不到5家。


2012年的中国移动appGPU份额调查

  作为中国移动app处理器的后续篇章今天我们就来介绍一下中国移动app处理器中GPU厂商的情况,小编只选叻5家我们平时接触到相关产品的厂商——Imagination、高通、ARM、NVIDIA及VivanteDMP和Takumi虽然份额不比ARM低,但是我们身边还真没多少处理器使用他们的GPU方案

  机是┅样的机,GPU上见高低

 ◆  中国移动appGPU的影响实例:不同机型画质大不同

  在水果与机器人的战争中,iOS阵营的应用软件及游戏表现的很统一特别是在游戏方面,这样的规格精简版表现普遍都会好于Android版Android阵营中高帅富机型与DS机型齐飞,同一个游戏在不同机型上的表现环肥燕瘦各不相同。


《史诗城堡》benchmark中不同机型画质不一

  以之前测过的一款名为为例它在高通、NVIDIA、PowerVR、Mali等GPU上的画质表现差异很大,有的地面纹悝很清晰有的就直接很模糊,锯齿严重

  这个问题既不是第一次被发现,也不是第一次有解释很多玩家都已经知道了造成这种画質差别的主要原因是游戏的纹理数据不一样,再深入一点就是游戏开发商针对每个处理器平台的特点使用了不一样的纹理压缩格式那些偅点照顾的GPU的游戏画面会很漂亮,之外的GPU有可能会存在各种问题

  由于中国移动appGPU的性能弱、带宽低(下文还有解释),游戏模型的纹悝不可能很精细至少不能跟桌面GPU相比(手机的小屏幕、高PPI已经帮着遮羞不少了),在带宽有限的情况下哪种纹理压缩格式压缩比更高、画質损失最小就成了关键游戏开发商选择支持哪种纹理压缩格式就带来了画质上的不同。

  目前五大GPU厂商中每家的中国移动appGPU产品至少都會支持一种通用的纹理压缩格式有的还支持自己的独家纹理压缩技术,简单来看一下

主流纹理压缩标准:ETC、PVRTC、S3TC简介

  首先说OpenGL ES标准中嘚,2.0版规范中将ETC(Ericsson Texture Compression)作为基本的纹理压缩标准这是大部分中国移动appGPU都会支持的纹理标准。OpenGL ES 3.0中还引入了ETC2、EAC纹理压缩格式二者基本一致,只不過EAC主要用于1-2通道数据的情况目前ECT2还在改进中,除了高通的Adreno 320之外还没有中国移动appGPU支持Tgera 4也不行。

  此外OpenGL ES 3.0中还有一种可选纹理压缩格式——ASTC(Adaptive Scalable Texture Compression,自适应扩展纹理压缩)这是ARM提出的,去年被Khronos组织认可纳入到标准中来,不过并不是强制性的目前也只有Mali-T600系列支持。

  说箌S3TC之前苹果和HTC大打专利战的时候就涉及到了这个标准,S3已经归为VIA威盛旗下HTC和威盛又有同一个老板——王雪红。为了支援HTC打专利战威盛去年就把S3部门出售给了HTC,算是左手倒右手吧

  S3TC是DX显卡都支持的标准,NVIDIA也在Tegra中支持了这个标准S3TC根据不同算法又分为DXT1-DXT5这五个级别,Terga支歭的实际上是DXT1、DXT3和DXT5

  目前来说我们能常用到的纹理压缩主要是ETC、PVRTC、S3TC、ATITC这四种种。

主流紋理压缩格式优缺点

  先来看压缩比如果无夨真的PNG压缩容量是5.4MB,那么S3TC和ETC都能压缩到1.1MBPVRTC压缩最高,可压缩到528KB不过PVRTC的问题在于它只支持PowerVR系列GPU,有排他性高通的Adreno支持的ATITC同样有排他性,其他厂商并不支持

  ETC是最通用的纹理压缩格式,不过ETC并不招厂商待见因为ETC纹理压缩不支持alpha通道,所以只能用于压缩不透明的材质鈈过ETC也有自己的优点,几乎所有的安卓设备都可以支持ETC压缩的GPU加速

  S3TC无论压缩速度还是压缩比都不错,也支持GPU加速而且是桌面显卡通用的压缩格式,看起来是最完美的选择可惜的是中国移动app市场跟PC不一样,大家各自为王NVIDIA现在还没强大到让其他GPU厂商低头采用S3TC标准的程度,因为S3TC说到底还是一种私有的标准有专利上的麻烦。

  ETC2压缩标准补全了ETC1不支持alpha通道的缺陷支持更高质量的RGBA(RGB+Alpha)压缩,而ARM提出的ASTC標准在压缩速度和质量上比S3TC要好但是这两种压缩格式都是新出的,支持的厂商实在太少了

  中国移动appGPU相对桌面级的GPU只能算是未长大嘚小孩子,虽然小孩子在某些场合也能比成人更有优势(比如杂技、柔术之类的表演)但在力量上还是有先天的差别,主要表现在理论性能和带宽上

  与桌面GPU动辄256bit甚至384bit的位宽、1.2-1.5GHz的高频显存相比,中国移动appGPU不仅要和CPU共享内存带宽而且普遍使用的是双32bit位宽、LPDDR2-800或1066左右的内存系统,总带宽普遍在10GB/s以内悲催的使用的还是单通道内存模式,搭配L的带宽不过6.4GB/s


目前GPU性能最强大的带宽也不过17GB/s(图片源于Anandtech)

  中内存带宽最高的是iPad 3/4,因为他们使用Retina屏幕的高分辨率对GPU带宽要求更高,不过就算是这两款产品17GB/s的带宽与PC显卡上动辄200GB/s以上的带宽相比还是小兒科了。

  没有高带宽就没有大容量纹理数据也就不会有高画质。尽管带宽不是制约中国移动appGPU发展的唯一因素但是在目前的限制下,中国移动appGPU厂商关心的头等大事就是如何在尽可能小的带宽需求下提升GPU性能及画质前面介绍的纹理压缩是一个方法,还有一种就是使用鈈同的渲染方式主要有IMR、TBR及TBDR等。

伤不起的“立即渲染模式”——IMR

  IMR(Immediate Mode Rendering)就如字面意思一样——提交的每个渲染要求都会立即开始这昰一种简单而又粗暴的思路,优点缺点都非常明显如果不用为性能担忧,这种方式会很省事但是IMR的渲染实行的是无差别对待,那些遮蔽处理的部分依然会被渲染处理器这也导致无意义的读写操作更多,浪费了大量性能和带宽

  总之,IMR这种渲染方式在中国移动appGPU上的評价只能是“负分滚粗!”。

变聪明了的“贴图渲染”——TBR

  IMR傻大粗的做法不可取那就来一个聪明点的方式——TBR(Tile Based Rendering,贴图渲染)咜将需要渲染的画面分成一个个的区块(tile),每个区块的坐标通过中间缓冲器以列表形式保存在系统内存中这种渲染方式的好处就是相對IMR减少了不必要的渲染任务,缺点就是遮蔽碎片依然会少量存在而且需要中间缓冲器。


TBR渲染将游戏画面分为不同的区块

再次进化的渲染方式登场——TBDR

Removal隐藏面消除)等进一步减少了不需要渲染的过程,降低了带宽需求实际上这些改变和PC上的渲染有些相似。


TBDR渲染的一个关鍵是延迟渲染

  其他几家厂商用的都是TBR技术TBDR主要是Imagination在使用,这也是他们最大的筹码之一

  在微软的升级中也有提到支持TBDR,因为系統还专门为平板和触控优化对TBDR这种中国移动app平台常用的技术加以优化也是必然的。

  Imagination技术公司并不介入ARM处理器生产他们专注于是中國移动appGPU技术授权,因为专业所以强大Imagination绝对是中国移动app平台GPU授权的老大,即便是Intel的Atom处理器及桌面的GMA 500也使用了PwerVR系列GPU核心他们的触角伸得很廣,并不局限于ARM阵营

  Imagination也是一家英国公司,早前还有个部门VideoLogic在3D加速卡方兴未艾的那个年代,VideoLogic也曾参与了Voodoo、NVIDIA、ATI等公司激战3D加速卡的战役可惜最终存活的只有NVIDIA和ATI(AMD),不过失之东隅收之桑榆Imagination的中国移动appGPU技术部门PwerVR反倒有所收获,在中国移动app市场上他们又可以俯视NVIDIA了

  Imagination公司的授权伙伴主要有Intel、苹果、联发科、LG、高通、瑞萨、三星、海思、Marvell、索尼等等,几乎都是大腕其中Intel和苹果还是Imagination公司的大股东之一。

  近年来Imagination公司也不再满足于中国移动appGPU技术授权了去年底,已经把MIPS架构融入到自家Mtera处理器中了CES展会上,Caustic公司展出了Caustic 光线追踪加速卡而这家公司也被Imagination收购了,看来他们的业务范围还在扩大

  图形规范方面,PowerVR SGX 5XT依然支持OpenGL ES 2.0/1.1、DX9不过该系列依然增加了新元素,自SGX 544开始支持PVRTC2紋理压缩格式全系列引入了部分OpenGL ES 3.0中才有的技术,比如MRT多目标渲染、遮蔽查询、无缝立方体映射、浮点纹理等新功能

  当然,这么高嘚性能只有PowerVR 6系列的的旗舰型号可以达到从高到低总计有G6630、G6400、G6430、G6200、G6230、G6100等型号,其中G6100、G系列专为核心面积优化适合组成单核、双核或者四核设计。

  Imagination能成为中国移动appGPU的老大显然会有很多独特优势和技术他们的GPU不是性能最强的,也不是核心面积最小的不过PowerVR的单位功耗性能、单位面积性能表现都很强,多核集成、配套的开发工具、纹理压缩格式、TBDR渲染技术都是他们冲锋陷阵的利器综合起来PowerVR就是表现最优秀的中国移动appGPU授权之一。

  堆砌大篇PowerVR详细架构的文字也没什么意思其中一个让人感兴趣的问题是PowerVR 5及5XT是否使用了统一渲染架构。从找到嘚资料来看PowerVR的USSE引擎中第一个U代表的意思在目前的官网上是指Universal通用,但是早期的发布新闻上这个U代表的是Unified也就是统一渲染的意思。

  架构图中PowerVR 5之后的GPU中不再有VS和PS这样的单元都叫做“Unified Scalable Shader Engine”(统一超标量渲染引擎),再加上它们都支持DX10规范因此PowerVR 5之后的GPU实际上已经是统一渲染架构了。再考虑到PowerVR 5是在2005年宣布的桌面级的统一渲染架构是2006年发布的,这就可以说明Imagination的技术实力是多么强大

点评与展望:PowerVR 6啥时候上市

  对一个占据了绝大多数市场份额的公司也没有继续赞扬的必要了,苹果、联发科等大客户的销量就能说明一切虽然发布了好几年了,PowerVR 5/5XT依然是目前追求极致游戏性能的最佳选择之一

  问题是PowerVR 6,架构发布及PPT宣传都快一年半了现在连影子都没。PowerVR 6的性能提升很夸张制程工艺及实际应用都要跟得上才行,前几天正好有新闻说这一下子就给支到至少2014年了。

  发布时PowerVR 6已经有6家厂商换的授权其中三家是TI、联发科和ST-Ecricsson(意法-爱立信),还有三家没宣布不过结合之后的消息来看三家没公布名称的厂商至少有海思,而LG也在今年的CES展会上首次公咘了PowerVR 6平台说明他们也在授权内,瑞萨也展示过PowerVR 6平台算起来差不多就是这三家了,苹果是否愿意获得PowerVR的授权就不得而知了

  只是时過境迁,TI目前退出了消费级嵌入式处理器市场,即便是公开展出的PowerVR 6也全都是大块头集成到智能手机和平板所用的超低功耗处理器中还佷远。

  ARM公司不仅提供ARM处理器授权他们也有一整套GPU授权方案——Mali。由于亲生的血缘关系Mali在好爸爸ARM的帮助下也攻城掠地,很多不具备獨立开发GPU技术的芯片供应商都直接使用了ARM处理器+Mali GPU的设计比如三星、瑞芯微、展讯、意法半导体、全志等,其中三星和全志还是出货量大戶所以Mali GPU的份额和出货量可不低。

  ARM官网显示Mali GPU在智能电视和Android平板中占有率第一智能手机市场占有率超过20%,2012年出货量高达1亿(一说是1.5亿)使用Mali GPU的终端超过200多种。

  说到Mali的历史ARM原本也是没有GPU授权的,此前他们也是使用Imagination的GPU核心Mali其实是源于2006年收购的一家挪威特隆赫姆地區的中国移动appGPU芯片厂商Falanx,ARM公司的Mali GPU开发中心也就落户在哪里现在Mali已经变成了ARM的亲儿子了。

  Mali-400 MP在Mali-300基础上做了改进制程和频率不变,不过L2緩存可配置8-256KB而MP后缀的加入意味着Mali-400可配置多个GPU核心,每个核心包括内存系统在内核心面积为4.7mm2最多可配置4个核心,三星Galaxy S3中使用的Exynos 4412就是Mali-400 MP4的配置因为32nm

  Mali-T600系列是去年才开始露面的新一代产品,支持OpenGL 3.0和DX11规范使用了统一渲染架构,支持OpenCL和DirectCompute加速T600系列实际上也发展了两代了,露面朂早的Mali-T604是第一代Mali-T624/628/678等后续产品则是第二代架构了。

  ARM没有公布Mali-T604的具体频率及核心面积、性能只说是前代产品的5倍性能。

  Mali-T624的规格参數基本与T604一致不过核心升级到了第二代Midgard,T628最多能支持8核配置

  昙花一现的Mali-658还是第一代Midgard架构,现在已经被二代Midgard架构的T678取代之前的资料显示T658的性能是Mali-400 MP的10倍,计算性能是后者的4倍Mali-678只会比这个指标更强。

  Mali-T600还支持ARM开发的ASTC纹理压缩格式现在已经成为OpenGL ES规范中的一个可选纹悝标准,其压缩率更高内存带宽要求更低。

  ARM的Mali GPU给人的感觉更像是PC中的公版显卡一样积极支持各种最新标准,注重性能功耗比以Mali-400 MP4為例,整合256KB L2缓存及内存之后核心面积也只有6.8mm240nm LP工艺及250MHz频率下像素填充率就有1000MPix/s,28nm工艺的的GPU核心面积10.5mm2像素填充率为2688MPix/s,但是它的频率高达672MHzMali-400 MP4如果使用同样的工艺和频率的话性能不会比它差,Mali-T600系列号称同样核心面积下IPC性能提高了50%

  但是Mali GPU的问题在于目前授权使用的大部分还是Mali-400 MP以丅的,Mali-450 MP都没有多少厂商集成Mali-T604除了在三星的Exynos 5250中有过应用,发布过一年多以来未见其他处理器集成即便是三星这个老朋友,新一代的Exynos 5 Octa也改鼡PowerVR的GPU核心了Mali又少了一个可靠的合作伙伴。

  尽管三星的换门会给Mali带来一些短暂的麻烦不过ARM的CPU+GPU一条龙方案对很多实力不足的厂商还是囿很强的吸引力,在中低端市场Mali GPU依然有自己的一席之地份额不可小视。

◆  未来的和尚会念经——高通的Adreno

  作为屈指可数(如果不是唯┅一个)可以自己改进ARM指令的厂商说高通是安卓阵营中国移动app处理器一哥估计没人会反对,再加上高通的3G技术及基带上的优势高通处悝器绝对是近年来最热门的选择之一,顺带着也把高通的Adreno图形核心带火了

  跟ARM亲生的儿子Mali不同,高通的Adreno其实是领养的Adreno原本是ATI旗下的Φ国移动appGPU部门,当时叫做Imageon主要为当时的掌上平台提供图形核心,2006年AMD收购了ATI,Imageon部分也进入了AMD公司收购ATI之后AMD就进行了改组,Imageon部分很不幸地成為多余资产最终在2008年末被高通以区区6500万美元的代价买走,现在就是高通的Adreno图形部门了(不知道AMD看到现在的情况是否会后悔?)

  高通与AMD的纠葛还没有完,他没有加入NVIDIA或者Intel最终去了高通公司去负责中国移动appGPU的发展,AMD后来则挖到前苹果副总Mark Papermaster做新任CTO这也算是AMD对

220系列的資料也非常少,目前只知道二者的架构基本是一致的使用了统一渲染架构(高通原话),都是8组渲染管线每组渲染管线中有4个矢量ALU单え和1个标量ALU单元组成,矢量单元可执行4个MAD指令操作不过标量单元不能执行MAD指令,因此每组渲染管线依然是每周期执行4个MAD指令的能力

  随着四核APQ8064处理器的上市,高通处理器的GPU目前已经转向了Adreno 320了骁龙S4的升级版骁龙600集成的也是Adreno 320,不论架构还是性能都比之前的Adreno 22x系列都有明显優势

  虽然前面的220/225中高通也说是统一渲染架构,但是Adreno 320才是高通第一款真正意义上的统一渲染架构的中国移动appGPU支持最新的OpenGL ES 3.0规范,加强叻GPGPU通用计算的比重性能比前代Adreno高了3-4倍。即便是目前来说已上市的四核处理器中APQ8064的图形性能也是拔尖的,除了华为的Ascend D2之外其他5寸1080P手机基本都使用了APQ8064处理器。


CPU和GPU都可以加速游戏性能提升

  今年初高通又公布骁龙800处理器与骁龙600继续使用Adreno 320(虽然也会有所改进)不同,骁龙800將使用更新的Adreno 330高通表示Adreno 330的性能是Adreno 320的1.5倍,计算性能则是它的3倍而且会支持Ultra HD标准的4K视频,听着非常诱人不过实际体验还得等相关产品上市再说,也要到下半年了

  无论从哪方面看,高通用6500万美元收购AMD旗下的中国移动app图形部门都是一笔超划算的买卖Adreno带给高通的收益恐怕是一百个收购额也比不了的。

  对高通来说就算不考虑Adreno图形核心的性能如何,仅凭着高通在CPU和基带上的优势Adreno都能在整个市场上保留一席之地,更何况目前的Adreno 320依然是图形性能最高的中国移动appGPU之一大者恒大还是有道理的。

  在这个江湖里NVIDIA算是后起之秀前一篇的中國移动app处理器门派划分中小编将其归为“峨嵋派”,虽然开宗立派时间短但是后来居上,再加上NVIDIA在PC市场的影响力他们虽然是资历最浅嘚外来户,但在GPU技术上实力雄厚前途无量。

  Tegra系列从AP2 2500开始到现在也出过四代产品了其GPU核心也沿用了GeForce的命名,一般称为GeForce ULP(Ultra-low power)超低功耗之意。第一代的Tegra虽然也曾被微软的Zune HD青睐不过目前来说已经是古董级产品了,NVIDIA官网也将其除名介绍的只有Tegra 2、和,我们也从他们说起吧

  NVIDIA的中国移动app处理器往往是发布最早的,Tegra 2是世界首款双核Cortex-A9架构处理器Tegra 3是首款四核Cortex-A9处理器,Tgera 4则是发布最早的世界首款四核Cortex-A15处理器这吔算是Tegra系列的一个前期优点吧。

  Tegra 3是我们的老朋友了也是NVIDIA目前的绝对主力,四核Coretx-A9架构GPU中有12个图形单元,分为4个顶点单元8个像素单え,运行频率有416MHz及520MHz两种其中微软Surface RT、Google 使用的就是416MHz版本,高端手机和平板中使用的则是520MHz版本

  Tegra 4现在已经发布,不过还没有具体产品上市只能说是今年下半场的主力。与Tegra 3相比它的架构、工艺都有升级,制程升级到28nm HPL工艺CPU核心升级为四核Cortex-A15,GPU单元数量则从前代的12个跃升到了72個实际运行频率约为672MHz。

  另外还有一个精简版的Tegra 4i制程工艺也是28nm,CPU核心为四核Cortex-A9 r4p1改进版GPU单元减少到60个,不过它整合了LTE基带功耗和发熱更适合手机使用。

架构设计:源自NV4x

  Anandtech此前针对Tegra 2、3、4的GPU架构做了一番分析Tegra的核心依然是传统的顶点和像素单元分离设计,即便是新一玳的Tegra 4也不例外并没有使用统一渲染架构。

  Tegra 2有一组顶点和一组像素单元每组各有4个ALU运算单元,Tegra 3的顶点单元不变增加了一组像素单え,变成4+8形式Tegra 4的顶点单元有6组,24个ALU单元像素单元则由4组,每组包含12个ALU单元24+48的形式组成了72个图形单元。

  Tegra 4i则在Tegra 4的基础上砍掉了三组頂点单元还剩下12个定点单元,48个像素单元不变总结是60个图形单元,不过砍掉了一半的顶点单元意味着其三角形生成率会大幅下降

  NVIDIA这几代的Tegra处理器的GPU核心架构其实没什么变化,都源于早期的NV4x架构每个ALU单元每周期可执行4个MAD指令,Tegra 4的顶点单元规模是Tegra 3的6倍像素单元管線是Tegra 3的2倍,不过每组管线的规模又是Tegra 3的3倍像素单元的规模总体还是Tegra 3的6倍。

  不过Tegra 4的GPU核心也在效能方面做了改进增加了L2纹理缓存,提升了像素渲染的最大寄存器(从16提高到24)等等

  另外,Tegra 4的672MHz的运行频率也比Tegra 3的520MHz要高因此理论性能方面的提升如下:

  最后,Tegra 4虽然不能唍整支持OpenGL ES 3.0规范不过其中的大部分技术都是支持的,比如多目标渲染、遮蔽查询等新增技术都有支持

1. 坚持小核心战略,单位面积性能取勝

  与桌面/专业卡中更追求性能的战略不同NVIDIA在Tegra处理器上反倒谨慎了许多,非常注重控制芯片的核心面积Tegra 4在规格大幅提升的同时依然將核心面积控制在了80mm2左右,其中GPU核心面积只有10.5mm2与竞争对手相比小了许多。


GPU核心面积都被换算到了等效28nm工艺下

  这就给NVIDIA带来一个宣传上嘚优势——单位面积性能足以秒杀目前的竞争对手不论是高通的APQ8064还是苹果的A5X、A6X,在这个指标上都被斩落马下

  当然了,Tegra 4的绝对性能吔不差此前官方公布及现场演示都表明其安兔兔得分高达3.6万左右,比目前的跑分天王APQ8064最高2.1万分的成绩高了50%

2. 游戏优化不错,THD专属给力

  虽然NVIDIA在PC平台的游戏优化被AMD的Gaming Evolved慢慢超越但是中国移动app平台是他们的心头肉,跟厂商合作的优化还会继续深入Tegra系列还有专属的THD游戏,专門为NVIDIA的处理器优化

  此前的一个例子就是EPIC的,虽然Tegra 3的理论性能被高通APQ064打个落花流水不过在这个demo测试中Tegra 3的成绩普遍好于APQ8064,更大幅领先彡星的Exynos 4412等处理器


没有Tegra 4,你游戏中的妹子都不够靓

  Tegra处理器其实还有一个最大的优点那就是相关设备价格比较便宜。以四核Tegra 3为例它巳经在两千甚至一千元内的四核手机中有过应用,北斗小辣椒、中兴V985、天语大黄蜂等等其中的代表影驰的999元四核平板使用的也Tegra 3处理器,看来黄总为了出货量也在价格上拼了

  说到Tegra处理器的不足,那就是发布早上市晚的惯性了很容易让后来者超越,Tegra 3是最早的四核Cortex-A9但昰等到上市铺货的时候别的厂商的28nm四核都来了,Tegra 3性能上不再有优势了40nm制程的功耗也比别人高,Tegra 4现在也是差不多的情况1月份发布的,平板和手机要想用上Tegra 4恐怕得到下半年甚至年底了

  另外一个让人揪心的就是功耗了,Tegra 4迟迟不能应用就多少受到了这方面的影响据分析Tegra 4嘚功耗高达5W,用在手机和平板中还有很大的难度公平地说,功耗升高是所有四核Cortex-A15处理器都要面对的问题但是谁让Tegra 4最早发布呢,它必然苐一个承受这个非议

  Tegra 4还没有上市,NVIDIA又在前不久的GTC 2013大会上规划好了Tegra 5以及Tegra 6了与目前的架构相比,后两者的变化可谓革命性的

5明年有鈳能成为最先进的中国移动appGPU之一。

  回头来看随着GPU在中国移动app处理器中分量越来越重要,在GPU技术上有先天优势的NVIDIA未来还是值得看好的目前的Tegra 3和Tegra 4还是小改款,但是明年的Tegra 5意义大不同了超强的技术规范及GPU通用计算的加入有望大幅提升GPU的应用范围,这在ARM处理器阵营中可算昰蝎子尾巴——独一份了

  与PowerVR、Mali、Adreno等明星相比,Vivante公司的GC系列GPU核心就不太为人熟知了就连市场份额比它少的Tegra系列都比Vivante知名。去年让Vivante露┅大脸的是华为旗下的海思K3V2这颗号称“世界最快四核”的在华为去年的Ascend D1四核、荣耀2四核以及今年初的Ascend

  Vivante其实还是挺有资本的,创立于2004姩创始人好像还是个华裔,他们专注于中国移动appGPU市场2010年的时候就有超过40家授权单位,主要客户有Marvell、飞思卡尔等很多人不知道的是国內的瑞芯微电子的RK2918以及自主知识产权的国产明星“龙芯-2H”使用的也是Vivante的GPU核心。

  Vivante给人的感觉就是“小众”好听点的说法是“Vivante虽然小众,但是性能出众”难听点的说法是“Vivante的GPU性能出众,但是市场小众”只不过从市场统计上看,Vivante的GC系列在中国移动appGPU的份额上仅次于PowerVR、Adreno以及Maliの后2012年上半年的全球份额是9.8%,比Tegra的2.5%份额要高得多说起来Tegra才是小众,他们是大众产品呢只不过Vivante在消费级的智能手机和平板领域确实露媔太少,给人的印象是“小众”

  双核GC4000的理论性能可达96GFLOPS,核心面积24.8mm2单纯的数据指标不好理解,我们拿它与苹果A5X做个对比后者使用嘚PowerVR 554MP4核心,理论性能为76.8GFLOPSGPU核心面积约为36.6mm2,32nm工艺这说明双核GC4000在制程工艺落后的情况下核心面积更小,但是理论性能更强

  GC系列性能如此強劲的一个原因还在于它的高频率,他们的GPU通常有AHB和AXI两个接口AHB总线下运行频率为400MHz,AXI总线下可达600MHz这可比A5X的GPU 250MHz的频率高得多。

  至于未来嘚产品规划2011年的路线图上就规划了性能更强的GC600和GC800,原本预计在2012年Q1季度亮相使用的工艺甚至会升级到20nm,不过目前来看Vivante最成熟最高端的产品还是GC4000后两者并未见到产品发布及上市。

  现在来汇总一下Vivante的GC系列GPU核心的一些特点

1. 支持业界标准,兼容多种API规范

  这一条本来是Φ国移动appGPU厂商的基本工作但是鱼龙混杂的市场Vivante对业界标准的支持还是非常好的,因为他们本身就是标准制定者Khronos中的成员对OpenGL ES、OpenCL、OpenVG以DX等规范支持的比较好。

  当然了Vivante的硬件还要继续升级,目前的GC4000还只支持OpenGL ES 2.0也没有采用统一渲染架构,制程工艺也应该升级

2. 最高的性能/面積比

  前面的规格介绍中就可以看出GC系列GPU的优点是核心面积小,理论性能高二者集合在一起就是Vivante的GPU有着业界最高的单位面积性能。

  与ARM的Mali、Imagination的PowerVR相比GC系列的单位面积三角生成率是其他厂商的3倍,像素填充率是1.5倍浮点性能是他们的2.5倍。

3. 高倍抗锯齿下的低带宽要求

  Φ国移动appGPU开启MSAA抗锯齿之后三角形生成率直线上升对带宽的要求更高,Vivante的GC系列对带宽的要求就没有其他厂商那么高性能损失也更小。

  GC系列根据GPU不同负载可分为活动、空闲、待机及睡眠多种状态可以根据需要实现不同的性能配置。整合了先进的频率/功耗门控电路可鉯动态开关GPU电路,独立的PLL电路还可以实现不同的频率调节厂商还可以通过软件来调节GPU的功能。

  Vivante的GC系列GPU还有一个优势前面也提到了除了支持标准的纹理压缩格式外,它还支持S3TC压缩格式跟Tegra是通用的,所以理论上THD游戏在Vivante的GPU上也会有同样的特效

  说完了优点再来看看咜的不足,Vivante的GC系列GPU号称有着业界最高的单位面积性能而且双核GC4000的配置在性能上已经秒了iPad4,但是实际使用中并没有这么夸张就算最常见嘚跑分测试中它的3D性能不仅没达到iPad4的高度,高通的Adreno 320都要好很多再算上有些游戏还存在兼容性问题,Vivante的GC4000有点名不副实

  造成这个现象嘚原因主要是GC4000核心在智能手机/平板上应用较少,开发商优化不足但是Vivante自己的因素也不可忽视,其强大到逆天的理论性能是通过高频率了實现的但是实际使用中为了节能,GPU核心频率通常很很低游戏中因为功耗和发热的限制也不会全速运行,这就形成了强烈的对比——跑汾强游戏性能一般。

  具体的例子就是有人解析了华为手机的文件后发现荣耀2四核存在着对主要测试程序的优化,跑测试时超频运荇现在看来加压超频的可能并不大,更可能的情况是:测试时GPU运行在最高的600MHz频率下(GC4000可支持的最高频率)但是实际使用中频率往往只囿200-300MHz左右,这种反差带给人的感觉好像是华为手机在超频运行是在作弊。

  总之Vivante的GC系列GPU核心核心面积小,理论性能强大有着业界最高指标的单位面积性能比,但是Vivante的主要客户并不在智能手机和平板市场上所以实际应用中优化不够给力,跟理论性能有很大差距而缩尛这个差距也不是一天两天就能完成的,Vivante及华为还得努力

  话说回来,期待他们继续优化GPU和应用并不意味着华为及Vivante的产品不好从华為最近发布的固件升级及用户的反馈来看,主流的游戏中K3V2并没有什么问题大型3D游戏同样玩得转。

◆ 机是一样的机GPU上比高低

  的核心架构有ARM罩着(Intel的X86架构另算),各家厂商在CPU部分基本没什么区别即便是自行开发架构的高通也会与ARM保持兼容,中国移动app处理器从PC的小跟班┅跃成为能跟PC抗衡的大产业也多少得益于这种统一

  相比之下,中国移动appGPU就有点各自为政的感觉了某个游戏在不同处理器上不仅有性能高低的区别,画质、兼容性等方面还有三六九等之分安卓阵营的碎片化不只是Google的问题吧,GPU也多多少少做了几分“贡献”

  在列舉的五家中国移动appGPU厂商中,Imagination目前实力最强、份额最高不过小编觉得更有危机感的正是他们,因为他们是专业的GPU IP授权厂商自己不生产GPU产品,产品应用与否全靠授权合作伙伴的选择但是任何一个有远大目标的公司都不会任由自己的产品核心掌控在别人手里,Intel和苹果目前已經是Iimagination的大股东了说不定哪天有兴趣就把它给控股了。

  Imagination也不介入CPU部分不过他们实际上也有自己的处理器架构——Meta SoC,今年还重金收购叻MIPS公司MIPS架构也在融入Meta处理器中。除此之外Imagination还收购了光线追踪加速卡公司Caustic,R渲染卡都已经出货他们也不会鸡蛋都放在PowerVR这一个篮子里。

  至于ARM和高通他们的GPU份额不低,ARM能提供CPU+GPU一整套方案高通的CPU+Adreno GPU+基带的组合也是无往不利,前途也是光明的

  Vivante的GPU虽然理论性能极其强夶,但它跟Imagination一样都是专业点GPU IP授权公司份额则比后者少得多,小编觉得华为还是出手收购了它吧就算十几亿美金的价格,华为也能承受嘚了而且Vivante不是AMD或者Intel、NVIDIA这样的公司,美帝政府的阻力也不大不行就让报纸和央视整高通,理由就是高通的3G专利严重影响了我们的国家安铨玩不死他们。

  还有就是NVIDIA要说做GPU他们的技术实力是这几家公司中最强的,但是包括目前的在内的GPU架构其实还是相对保守NVIDIA预定明姩推出的Tegra 5才更有革命性。Tegra 5的架构会升级到真正的统一渲染架构而且会选择主流的Kepler架构,支持的技术规范也跨代升级到了OpenGL 4.3这是OpenGL ES 3.0的超集,DX11の类的规范应该也能支持

  面对比重越来越大的GPU加速,NVIDIA直接把专业市场的加速带到了ARM平台上这意味着以前很多需要CPU乃至单独的应用處理器才能进行的任务都可以让GPU来完成,这是所有GPU发展的大趋势之一也是NVIDIA准备的杀器。

  如果你也被NVIDIA成功洗脑了那么下边这句话可鉯把你拉回现实:虽然中国移动appGPU的性能和技术决定了未来,NVIDIA在这方面有优势但是市场成败的关键还要看厂商的功耗控制,在目前电池技術龟速前进的情况下没有可靠续航的中国移动app设备都是在耍流氓。

我要回帖

更多关于 中国移动app 的文章

 

随机推荐