365BET首页-浅析Arm全新MaliG76GPU:全方位进化,但仍不足与高通苹果匹敌

互联网

本文摘要:这种数据格式是处理神经网络的重要操作者,在机器学习推理小说是最重要的,尽管8位整数的精度受到限制,但在很多情况下基本推理小说还不够。

365BET官网

这种数据格式是处理神经网络的重要操作者,在机器学习推理小说是最重要的,尽管8位整数的精度受到限制,但在很多情况下基本推理小说还不够。迄今为止,MaliG71/G72也可以通过包装4个int8数据来计算,但MaliG76是第一个原始反对单周期处理int8的Mali核心。

根据工作阻抗和机械学习框架的不同,MaliG76的机械学习性能比MaliG71/G72提高了约2.7倍。同时,Arm研究发现影响GPU性能的另一个潜在瓶颈是重写机制。GPU在多边形反写过程中衰退的话,堵塞GPU的其他部分的可能性很高。Arm允许MaliG76从有序的回写机制变成无序的回写机制,通过跨越回写延迟,更加灵活地回写多边形。

此外,Arm还优化了MaliG76缓冲器,在某些情况下,当颜色缓冲器被消耗时,它可以暂时堵塞到深度缓冲器中。这样可以增加主内存采访的次数,尽量维持GPU核心的本地流量。

MaliG76的线程本地存储机制也适当优化了存储器的堵塞处理,GPU不会将堵塞的数据块分组提供给将来。性能和功耗预测Arm的GPU核心设计一直是团体p的构想,通过六边形核心数量对抗高吞吐量Adreno的大核心变化战略。迄今为止,MaliG71/G72至少可以反对六边形32的核心,但实质上SoC制造商没有自由选择MP32的下一个替代品。

最低只有三星Exynos895的MaliG71MP20,其次是Exynos9810的MaliG72MP18,华为麒麟970是MaliG72MP12,麒麟960只有MaliG71MP8。经常发生这种现象的原因是MaliG71/G72的单位面积性能差。以Exynos9810的18核MaliG72为例,GPU总面积为24.53分钟,是高吞吐量Adreno630(10.69分钟)的2.3倍,苹果A11分钟GPU(15.28分钟)的1.6倍,性能不及Adreno630和苹果A11分钟GPU。

讨论Exynos895以上的面积更大(32分mm)性能更低的MaliG71分MP20。三星Exynos9810核心透视图与三星狂堆核心数相比,麒麟970和960只用于中等数量的核心,通过提高核心频率来获得性能。但是(公共编号:)在上篇分析Cortex·A76的文章中,每个核心结构在某个技术下都有能源消耗比最高的频率区间,超过该区间后,接受高频需要大量的能源消耗成本。三星Exynos9810和8895GPU面积相当大,但频率只有560MHz左右,消耗电力很困难。

麒麟970的Malig72MP12为746MHz,功耗下降明显,能耗比Malig71的Exynostor8895略高。麒麟960的Mali·G71MP8频率甚至高达1037MHz,激增的电力消耗使其能源消耗率低于旧Exynos7420的MaliT760MP8。考虑到实际应用的状况和MaliG76核心规模的扩大,Arm要求MaliG76仅次于核心数量上升到20核心。

通过将功能模块和持续发动机整合到更少的核心中,可以提高核心的性能密度,提高GPU的单位面积性能。MaliG76在曼哈顿3.1测试中,每个mm的性能提高了39%,Arm回答说MaliG76MP12在7nm的技术下,比MaliG72MP18性能提高了50%与小龙845的Adreno630相比,MaliG76的MP12具有12.8%的性能优势,同时功耗上升了22.8%。(记录:MaliG76MP12频率不明)的结论和思维总体上,MaliG76的变革非常明显——单位面积性能提高了30%,消耗电力也大幅度提高。

但是,MaliG76虽然大幅度提高了Arm公版GPU的竞争力,但是足以在竞争对手中领先。在微架构优化方面,Arm无疑在整合核心和强化核心方面做出了准确的自由选择。Arm公版GPU的多核心战略是双刃剑,允许制造商根据自己的市场需求配备核心数量,但多核心也不会造成不可避免的性能和面积损失。

Arm预测了MaliG76MP12的表现,但与高吞吐量Adreno鄂630和苹果A11的GPU相比,12核过多。让我们看看MaliG72。MP18与AdrenoTo630的对比。即使MaliG76的每平方毫米性能提高了39%,也无法销售2.3:1的面积比。

使用7nm的MaliG76。MP12输给10nm的Adreno。630什么也说不出来。

如果两者都是7nm技术的话,意外的MaliG76的能源消耗和面积还没有显着的劣势。目前,MaliG76在实际芯片中能够表现出什么样的表现,Arm期待将来每个EU的计算资源再次加倍,这再次给竞争对手带来很大的改良,进一步增加与竞争对手的差距。

via:Anandtech相关文章:ARM新Cortex、A76架构浅析:2.4GHz后可杀死小龙845原始文章,允许禁止发布。下一篇文章发表了注意事项。

本文关键词:365体育在线,365BET,365体育,365BET首页,365BET官网

本文来源:365体育在线-www.ahxlstu.com

相关文章

网站地图xml地图