近期,国产GPU又迎来一波融资大潮,多家公司估值接近甚至突破300亿元,GPU行业呈现出百舸争流的局面。铁流简单盘点一下国产GPU的性能,谈谈各款GPU的前景和方向。
这里先说明一下,当下GPU可以分为三类,分别是AI、FP和渲染。AI就是英伟达近年推出的一系列用于深度学习的加速卡;FP则是那些用在超算上的加速卡,支持双精度的浮点数运算,可以做科学计算;渲染就是比较传统的做游戏、做桌面,做各种图形化应用。由于AI、FP更多是数据中心、超算上跑,和普罗大众关系不大,消费者会去买游戏显卡但不会买AI和超算计算卡,因而本篇文章主要谈真正可能进入寻常百姓家的GPU,也就是用于渲染的桌面GPU。
核显级GPU:兆芯、龙芯、飞腾、凌久、翔腾
这些厂商的GPU研发起步比较早,不少是配合自家CPU而开发的,比如龙芯集成在7A2000桥片里的GPU,兆芯集成在KX-6000G系列CPU里的GPU,以及飞腾X100上集成的GPU。在技术来源方面,有些厂商明确表示采用了外来技术,有些则没有公开声明。下面简单谈谈这些核显级GPU。
先谈兆芯,其GPU技术源自S3,2019年发布的兆芯KX-6000,其核显与S3的C645规格和性能类似,甚至连驱动都能共用, 3Dmark成绩为250分左右。媒体近期披露的KX-6000G核显3Dmark成绩为1000分左右,相对于兆芯6000提升了3倍,这个成绩和英伟达GT630差不多,性能作为核显是足够了,特别是当下党政办公Wintel电脑的独显也就这个水平。
龙芯在CPU方面起步很早,但GPU起步要迟很多。最初,龙芯在GPU上使用AMD桥片集成的GPU,后来购买了一款商用GPU IP。龙芯做GPU一方面是服务于自身发展的需要,另一方面也是因为遭遇“卡脖子”。当时,该商用GPU有Android操作系统的驱动程序,但龙芯需要Linux的Xserver驱动,厂家自己开发不了,龙芯希望厂家提供内部配置寄存器如何使用的手册,由龙芯来自己开发。然而,厂家以商业机密为由不肯提供。至今,龙芯2H只有在Android上有3D驱动,Linux的Xserver驱动只有2D的。这使得龙芯非常难受,无论是AMD的桥片,还是所购买的商用GPU IP都存在被卡脖子的风险,因而只能自己开发GPU。龙芯7A1000桥片集成的GPU是基于某款商用GPU IP进行重写,7A2000桥片集成的GPU则是在前代GPU基础上的迭代演进。龙芯GPU的性能比较弱,基本属于亮机卡的范畴。
飞腾的GPU技术来源不明,官方宣传也非常少,只在招股书上看到GPU的只言片语。由于缺乏性能参数介绍,加上飞腾在GPU方面缺乏技术积累,根据用户反馈,铁流推测飞腾的GPU和龙芯GPU比较类似,都属于亮机卡的范畴。
凌久GP101由中船重工研发,技术来源未知,可能是自主正向研发的。凌久GP101性能参数资料少的可怜,但从其仅支持OpenGL 2.0可以看出,性能是非常有限的。根据用户的使用反馈,基本可以认为和飞腾、龙芯的GPU处于同一个档次。
翔腾和景嘉微的GPU大致起步于同一时期,最初都是基于特定装备的需求,只不过景嘉微之后走了更加商业化的路线,更加注重宣传,翔腾则依旧深耕装备领域。这也产生了截然不同的结果,此后,景嘉微开发了JM7200和JH920,进军信创市场,而翔腾的HKM9000则用于C919。景嘉微早期的JM5400和翔腾的HKM9000都属于亮机卡级别的。
独显级GPU:芯动科技、格兰菲、景嘉微
由于国产GPU性能偏弱,这里的独显级GPU相对于国外产品而言差距巨大,特别是这几年英特尔、AMD的GPU性能大幅提升,直接导致部分国产独显级GPU和国外顶尖核显性能差距拉大。当然,我们在看到差距的同时,更要看到国产GPU的进步,下面谈谈这三款独立显卡。
首先看风华2号。风华2号由中国一站式IP和GPU领军企业芯动科技研发,他们从事IP开发已经有16年,在中芯国际最先进的还是90nm工艺时,芯动科技就开始自主开发IP。目前,芯动科技已经研发了近百个IP,进入了全球各大顶级晶圆代工厂的各种工艺制程,而且这些IP均实现了量产,历史客户群涵盖中兴、瑞芯微、全志、君正、AMD、亚马逊、高通等公司。最近几年,芯动科技将业务拓展至新赛道,着手GPU研发,目前是基于Imagination(已被中资收购)的GPU架构自主开发,同时采用全套自研高性能IP。和苹果公司一样,芯动在架构授权的基础上不断优化GPU内核,现已完整独立掌握了GPU内核演进架构图,实现了自己的GPU架构把控,并将以每年发布两款GPU的速度迭代演进。
由于风华2号刚刚发布,目前还没有3DMark成绩,只能从其规格上推算其性能。以下为基本参数:GPU像素填充率48GPixel/s,FP32单精度浮点性能1.5TFLOPS,AI运算(INT8)性能12.5TOPS,实测功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API。作为参照,英伟达GT1050像素填充速率为43.3 GPixel/s,FP32为1.862 TFLOPS,TDP为75W。就像素填充速率和FP32来说,风华2号和GT1050大致处于同一档,3DMark测试分数推算应当在GT75至GT1050之间。
格兰菲是兆芯把自己的GPU部门独立出去,同时吸引其他投资人入股成立的GPU公司。其技术流传过程是2000年VIA收购S3,10年前VIA把S3以合资方式归属兆芯,2020年兆芯又把GPU独立出去成立格兰菲,由于兆芯收购S3技术已经有10年了,在研发方面已经是国内团队挑大梁,走的是技术引进消化吸收再创新的路子。格兰菲最新的显卡是Arise-GT-10C0,单精度浮点性能为1.5TFlops,GPU像素填充率48GPixel/s,主频500Mhz,工艺28nm,TDP为45W,支持DX11和OpenGL4.5、Vulkan等API。从以上参数可以看出,Arise-GT-10C0的规格看起来与风华2号相似,但是功耗却是风华2号的3倍以上。
最后来看景嘉微JH920。JH920是景嘉微继JM5400、JM7200之后的第三代GPU,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等,但不支持DX。JH920制造工艺为14nm,FP32浮点性能为1.5TFlops,像素填充率达到了32G Pixels/s,显卡功耗为30W,从参数上看JH920在像素填充率和API支持上均逊色于风华2号和Arise-GT-10C0。
结语
如果把被中资收购的GPU IP供应商也加进来,那么,必须提一下Imagination和芯原微(图芯)。前者曾经是苹果公司的“御用”GPU IP供应商,技术水平很不错,市场认可度较高,拒绝苹果收购之后,苹果宣布“弃用”其GPU,直接导致Imagination股价腰斩,之后中资成为白衣骑士全资收购Imagination。芯原微的GPU源自其从美国收购的图芯,是国内老牌IP供应商。
目前,国内从事GPU开发的公司有几十家,有些厂商比较低调,其GPU未见于主流媒体。有些厂商发布了消息,但依旧犹抱琵琶半遮面,发布的信息中缺乏真正有价值的内容,虽然通稿中调子起的很高,但实际公开的参数非常少,很难让人估算其性能水平。还有些厂商的产品显然是针对数据中心、科学计算和AI的,比如沐曦的GPGPU、摩尔线程的MTT S2000、壁仞科技的BR100等等,因而这些就不在这篇文章里盘点了。铁流这里仅盘点已经出现在桌面市场或信息披露程度较高,将来有希望进入寻常百姓家的GPU。
必须说明的是,规格参数虽然能够一定程度上反映GPU的性能,但实际体验并不一定就与规格参数划等号。GPU核心设计能力不足和API支持不足,或是驱动方面的问题,都会导致GPU规格与体验倒挂的情况。
国产GPU在这方面的问题尤为突出,最典型的例子就是景嘉微JM7200,虽然堆了不少料,但API仅能支持OpenGL1.5而不支持DX,加上景嘉微在GPU核心设计上和软件优化上与英伟达差距很大,直接导致其GPU规格与体验倒挂。虽然一些媒体吹捧JM7200相当于GT640,但就实际体验而言,兆芯6000G所集成的核显都可以吊打景嘉微JM7200这款独显。
文末,铁流给GPU性能排个序,在核显或嵌入式GPU方面,龙芯、飞腾、凌久、翔腾差不多,都属于亮机卡,性能估计和AMD十多年前的集显差不多;兆芯可谓一枝独秀,其核显已经达到党政用户电脑独显的水平(机关单位电脑的独显基本上是GT610至GT730这种水平)。
就文章中介绍的三款独显来说,景嘉微JH920无疑是最弱的,尤其是在API的支持方面。由于景嘉微的GPU往往被第三方机构吹捧,评估虚高,比如某证券公司发布的材料中称JM9271性能不低于GTX 1080的水平,然而仅就当下披露的信息就能看出,JM9271游戏体验必然与GTX 1080差距极大。有鉴于JM7200、JM9271等累累前科,铁流认为JH920实际体验可能要相对产品规格打较大折扣。
芯动科技的风华2号和格兰菲的Arise-GT-10C0在性能方面处于国内领先水准,但鉴于前者的能效比远优于市场同等算力产品,且支持无风扇设计,可谓潜力满满。两者实际体验应该都不会弱于GT750,至于上限是GT750ti,还是GT1050,这就要看这两款GPU核心的设计水平和软件支持水平了,有鉴于国产GPU与英伟达在这方面差距众所周知,铁流对这两款独显实际体验的上限持谨慎乐观态度。
总之,以前国产桌面GPU与英伟达、AMD差距巨大,我们当下较好的独显,也就相当于英特尔、AMD高端核显的水平。庆幸的是,这几年的机遇实在是太好了,国内外环境、政策红利给予本土企业一个绝佳的发展机遇期。前路漫漫,道路曲折,但国产桌面GPU的前景异常光明。
「 支持!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!