查看:15 回复:0 发表于 2018-8-10 19:46
风姿

参加活动: 0

组织活动: 0

打印    举报
跳转到指定楼层

“吓人技术”到底是个啥?华为GPU Turbo两大流言深度辨析. [复制链接]


GPU Turbo 自 6 月份荣耀 Play 和荣耀 9i 发布会上以吓死人不偿命的姿态问世后,不怕死的吃瓜群众们纷纷带着瓜子饮料矿泉水小板凳围了个里三层外三层,一时间流言四起。这之中,有些低级流言我们一眼就能看出真假,而有些流言却要么利用人的心理,要么故作高深让人一些不懂,因而倒也传的似模似样。  淘宝刷单 http://www.nuomart.com.cn/
  但这些终究不可尽信,甚至可信者百里无一。今天雷锋网便与大家一起,辨析两条在玩家中传的似模似样的流言。

  GPU Turbo 只是华为花钱买优化?
  在 GPU Turbo 发布伊始,余承东便曾表示,GPU Turbo 技术在令 GPU 处理性能提高 60% 的同时,还可以将 GPU 功耗降低 30%。
  Really?性能提高 60%,功耗降低 30%,多么惊人的提升啊!笔者表示,手里的荣耀 9 都快握不住了啊~
  为了验证官宣的真伪,我们以 Anandtech 的测试来作参考,简单粗暴的判断一下。测试中搭在了麒麟 970 的华为 Mate10 跑出了 37.66fps 的成绩,在此基础上提升 60% 应该是 60.26fps;而功耗是 6.33W,在此基础上降低 30% 应该是 4.43W。

  因此,按照官方宣传的数路设计及投放的晶体管规模上有很大不同。
  更进一步的,我们可以得出一个基认为,华为在 15 年以后设计的麒麟芯片 GPU 里都设计了用于全局变量寄存器,同时为了保持专利申请到位前的应用,保留了 GPU 大外寄存格局。简单来说就是,华为没有改动 Mali G72 核心,也没有提高 Mali G72 的实际性能,但是在 GPU 区域加了寄存,同时修改了数据总线,提高了 Mali G72 的函数数据读存速度和效率。
  为此,这些分析者笑称GPU 里你也加 Cache?华而有钱,为所欲为,甚至还认为华为在 GPU 技术上已经吊打 NVIDIA。

  那么,麒麟 970 的 Mali G72 之所以变大这么多,就是因为华为在 GPU 里增加了高速缓存咯?
  笔者个人认为,这种可能性不能说没有,但真的很小。
  首先不得不纠正这些分析者的是,寄存器和 Cache并不是同一种东西。在存储体系中,Register 的位置要比高速缓存更靠前,它的速度比高速缓存更快而容量极小,为运算单元提供着指令寄存空间、程序计数缓冲以及累加器等多方面的服务。
  高速缓存在存储体系中位于 Register 之后。它有两大特点:第一是快,速度仅次于 Register;第二就是极其消耗晶体管,每 bit就要消耗多达 6 个晶体管。
  然而根据已知的消息,世界上第一颗集成高速缓存的民用级 GPU 是 NVIDIA 在 2001 年推出的 NV20,也就是 Geforce 3 系列显卡,其在 GPU 内集成了 128KB Cache 用于纹理缓冲。2004 年,NVIDIA 又在 Geforce 6800Ultra 的 NV40 核心中增设了大小为 128KB 的 L2 Texture Cache,之后 Geforce 7800GTX 的 G70 核心又将之增加至 288K。
  ATI 这边则是在 Radeon 1800XT 的 R520 核心中加入了完整的 L2 Texture Cache,并在 Radeon 2900XT 的 R600 核心中将其扩充至 256KB。而 Mali 系列 GPU 自 2008 年的 Mali 400 开始,也早已全线加入了 Cache 设计。根据 Arm 的官方设计参数,Mali G72 可以根据不同需求,自行配置 128KB~2MB 不等的 L2 Cache。

  可见,在 GPU 中设置高速缓存并不是什么的 GPU 基础规模差距基仅有的浅薄知识分析了这么久,也只能攻破以上两个流言,依然没能石锤 GPU Turbo 到底是什么。毕竟这是华为的独门黑科技,就连一向不服同行的罗永浩也交口称赞,其技术水平和难度可见一斑,真能被我们五六千字就扒个干净才是怪事了。
  不过在华为此前的一次 EMUI 公开课上,华为消费者业务软件工程部总裁王成录博士亲自出面解答了 GPU Turbo 技术的一些信息,为大家揭开了 GPU Turbo 神秘面纱的一角。
  大家都知道游戏画面是一帧一帧渲染出来的,相邻的两帧往往有很多相同的地方,而 GPU Turbo 技术将会只渲染画面出现变化的地方。也就是说,如果两帧之间可能有 80% 的画面是一致的,GPU Turbo 就会让芯片只渲染变化的 20%,从而减少 GPU 80% 工作量。
  渲染工作量的减少大幅提升了下一帧的帧数延迟,用户眼球感受到画面掉帧需要 16.7 毫秒的时间,华为 GPU Turbo 可以把下一帧的渲染时间控制在 7 毫秒以内,最快可以在短短 3 毫秒以内就完成下一帧的渲染工作。
  合理调度 GPU 资源,节省 GPU 性能到游戏最需要的地方,这才是 GPU Turbo 让游戏满帧运行的秘密所在。

  当然王成录博士只是对于 GPU Turbo 技术工作原理做了一个简要解答,至于 GPU Turbo 是如何判定并计算两帧画面之间的差别,王成录博士并未做解答,或许这就是隐藏在 Mali G72 多出来那 0.272mm中的商业机密吧。
  GPU Turbo 从立项到研发成功耗费了 5 年多的时间,王成录博士表示华为对此项技术非常自信,它的技术门槛非常高,其他家不太可能在短时间内跟进。此前国外 XDA 论坛上出现的 GPU Turbo 破解包也很快被证明是一场恶作剧而已,被国内数码爱好者戏称为装X不讲基本法。
  看来,GPU Turbo 的一切,还需华为亲自公开。
00
回复

使用道具 打印 举报

您需要登录后才可以回帖 登录 | 立即注册

XA12997S
发表新贴 回顶部