• 易迪拓培训,专注于微波、射频、天线设计工程师的培养
首页 > 手机设计 > 业界动态 > 深度剖析GPU在架构上的变化与最新进展

深度剖析GPU在架构上的变化与最新进展

录入:edatop.com     点击:

  Tegra 4的GPU子系统就是很好的例子,它从前代的十二颗GeForce GPU核心,一举提高到七十二颗,六倍的核心数也带来六倍于Tegra 3的绘图效能。Tegra 4及Tegra 3在GPU效能表现上的差异,请参考表1。在系统配置上,其架构中有所谓的顶点着色器(Vertex Shader)和画素着色器(Pixel Shader);前者让工程师可自订场景(Scene)中顶点的转换过程,后者则是用来控制画面上每个画素的着色计算。 

  更进一步来看,Tegra 4的作法是将七十二颗GeForce核心拆分为二十四颗Vertex Shader与四十八颗Pixel Shader。其中每四颗Vertex Shader组成一组顶点处理引擎(Vertex Processing Engine, VPE),所以有六颗VPE,分别具有16KB、96-entry快取记忆体,能够有效降低向外部晶片存取资料的需求。在相同时脉下,新的GeForce核心可以带来1.5倍于Tegra 3的效能,而前后代Vertex Shader数量相差六倍,相乘之下差距达九倍之多。 此外,Tegar 4总共具有四组画素管线(Pixel Fragment Shader Pipeline),每组画素管线可细分为三组算术逻辑单元(ALU),每个ALU则是由四颗GeForce核心(即Pixel Shader)组成。在实际运作时,会以ALU做为最小层级的单元,并称为多功能处理单元(Multi-Function Unit, MFU),因此Tegar 4总共具有十二组MFU,MFU可执行函数、三角函数、对数、倒数、平方根及MOV等指令(组合语言中的复制)。 

  降低多核心SoC耗电量 架构设计担当重任

  对于行动装置而言,电池的使用寿命与效能/功能表现占有同样重要的地位。同样是四核心行动晶片,因个别架构不同,往往也有不同的效能与功耗表现。以Tegra 4来说,除采用安谋国际(ARM)最先进的CPU核心外,透过可变对称式多重处理(vSMP)架构,可依照使用需求进行调配,让四颗效能核心发挥最大处理能力,并可视工作量,分别自动启用及停用各颗核心,以大幅节省电力。 

  为了提升续航力,Tegra 4延续Tegra 3的省电概念,在晶片中加入第五颗处理器核心,不过名称从协同核心(Companion Core)改为省电核心(Battery Saver Core)。当装置处于背景处理邮件、社交软体同步,或是播放影片、音乐等低效能需求情境时,系统将关闭效能核心,并使用省电核心负责执行程式。 

  就晶片设计观之,多核心处理器必定会面临记忆体频宽和整体系统功率的重大瓶颈,为了因应此议题,Tegra 4提出双通道(2x32位元)的记忆体子系统作法。此外,为减少对晶片外记忆体的存取使用需求,Tegra 4的GPU架构中规画顶点、画素、材质(Texture)专用的快取记忆体,让运算任务尽量在晶片内部完成,以提升处理效益和降低功耗。 

  另一个降低系统单晶片(SoC)功耗的重要策略,就是采用先进的电源管理技术。以Tegra 4来说,即采用多层级时脉闸控(Multiple Levels of Clock Gating)、显示要求群组(Display Request Groupig)、动态电压与频率调节(DVFS)等多种电源管理技术,针对不同使用情境将电源需求降至最低。 

  运算型摄影架构助力 行动装置影像效能升级

  再从应用端来看GPU架构的发展,今日的使用者非常仰赖行动装置来进行照相和和录影功能,且希望达到专业级的效果。不过,相较于相机,手机或平板装置在先天性上就难以配置太大的镜头,这时想得到高品质的影像,就得靠更先进的影像处理技术,甚至是运用电脑演算法来创造影像。 

上一篇:揭开智能路由器火热背后的创投密码
下一篇:荣耀VS小米:雷军输了?荣耀3C/3X频报佳绩

手机天线设计培训教程详情>>

手机天线设计培训教程 国内最全面、系统、专业的手机天线设计培训课程,没有之一;是您学习手机天线设计的最佳选择...【More..

易迪拓培训课程列表详情>>

我们是来自于研发一线的资深工程师,专注并致力于射频、微波和天线设计工程师的培养。

  网站地图