首页 > 文章 > 经济 > 产业研究

龙芯LA664性能追平AMD Zen3

铁流 · 2022-06-07 · 来源:铁君公众号
收藏( 评论() 字体: / /

  日前,龙芯发布了龙芯3C5000服务器处理器,并联合生态伙伴共同发布新一代国产服务器基础软硬件平台。这次发布会有两个亮点,一是3C5000处理器,二是3A6000仿真成绩。

  龙芯3C5000弥补服务器不足

  过去,龙芯一直致力于提升单核性能,没有盲目去堆核心数量。这种稳扎稳打的做法使龙芯在过去10年中IPC提升了3-4倍,在桌面CPU上成效立竿见影。

  但在服务CPU上,由于国内ARM CPU往往采用“堆核战术”,也就是用64核、128核堆出一款服务器CPU,这导致龙芯的四核CPU虽然在单核性能上更好,但在多核性能上不如ARM CPU。这使龙芯在服务器CPU市场竞争中处于不利地位。

  3C5000是龙芯第一款16核CPU,采用完全自主的LoongArch指令架构,16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。就SPEC2006测试来看,单核定点浮点Base分均大于10/G,单芯片分值超过200。可满足通用计算、大型数据中心、云计算中心的计算需求。该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持。

  3C5000最大特点是单核性能强,特别是unixbench这种看重单核核内存性能,多核加速比很低的测试,龙芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到这个成绩。从公开的数据来看,3C5000的性能在信创市场足够用了,而且16核的核心是使其部署比较灵活。另外,龙芯还会有3D5000,也就是把两个3C5000封装到一起的胶水32核芯片,主要针对一些对性能有更高要求的场景。

  龙芯3A6000 IPC追平Zen3

  相对于3C5000,铁流认为3A6000更加值得关注。相对于一些技术引进CPU在引进海外技术后CPU IPC增长缓慢,性能提高基本依靠购买更好的EDA工具和买台积电更好的工艺。龙芯一直致力于提升CPU微结构设计水平来提升CPU的性能。CPU的IPC在过去10年中提升了3-4倍,这使龙芯可以在制造工艺上落后技术引进的某ARM CPU一代的情况下,依然可以依靠CPU微结构设计水平做到性能持平或略优于技术引进的某ARM CPU。当龙芯与引进的某ARM CPU采用相同工艺时,龙芯可以凭借其IPC上的优势在性能上领先某ARM CPU。

  3A6000和3A5000采用相同制造工艺,龙芯依靠其设计能力把CPU性能大幅提升。从仿真成绩看,定点相对于3A5000提升30%,浮点相对于3A5000提升60%,这种提升是非常骇人的——如果仿真成绩与最终成绩相当,那么,3A6000 SPEC06单核定点Base分大于13/G,浮点Base分大于16/G,如果3A5000为2.5G至2.8G,那么,3A6000的 SPEC06单核定点Base分大于35,浮点将大于45,这个性能对于信创和日常使用而言都已经明显过剩了。

  (gcc,1165G7测试过程的频率大约是 4.2GHz,换算IPC 13.3/G。下图5600G的编译参数和1165G7基本是一样的。感谢guee帮忙测试)

  (gcc,int_base 48.6。测试过程中频率基本保持在 4GHz,也就是说 IPC 为12/G,由于测试还有调优空间,及5600G的缓存要比5600X少一半,可以认为调优后的Zen3可以达到13/G)

  作为参照,11代酷睿的IPC大约是定点13+/G,12代酷睿IPC大约是定点15+/G,Zen3的IPC大约是定点13/G,龙芯LA664能够达到定点13/G,浮点16/G,这已经追平或接近Zen3和11代酷睿。

  当下,在同频性能上追平11代酷睿和Zen3已经很不错了,唯一的问题就在于主频了。当龙芯把7000系列把工艺换成5/7nm就可以把主频做到3G以上,可以实现 SPEC06单核定点Base分大于40,浮点Base分大于50,这种性能已经达到英特尔、AMD市场主流水平,即便龙芯平台移植了3A大型游戏,龙芯7000系列CPU也足以应对。

  结语

  经过20多年的磨砺,龙芯终于把LA664提升到11代酷睿和Zen3的水平。LA664不仅超越了现有技术引进的ARM CPU,还超越了某些ARM CPU厂商PPT上的下一代CPU核。即便是当下国内首屈一指的海光,如果不把CPU IPC提升30%以上,面对LA664也要败下阵来。

  回溯历史,在10年前,龙芯的IPC是不如技术引进CPU的,某技术引进ARM CPU的IPC是当时龙芯的2倍左右。然后,技术引进是存在代价和陷阱的,往往是知其然不知其所以然,进而导致发展后劲不足。

  相比之下,自主研发虽然在起步阶段慢一些,苦一些,累一些,无法像技术引进CPU那要快速拿出产品,但自主研发发展后劲更足,这一点从龙芯过去10年的发展就能看出来。

  龙芯的性能已经不再是应用的障碍,唯一的障碍是软件生态。期待龙芯能以应用为阶梯,在合作伙伴的帮助下循序渐进构建可以与Wintel、AA体系相媲美的自主技术体系。

「 支持!」

 WYZXWK.COM

您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!

注:配图来自网络无版权标志图像,侵删!
声明:文章仅代表个人观点,不代表本站观点—— 责任编辑:冀鸣

欢迎扫描下方二维码,订阅网刊微信公众号

收藏

心情表态

今日头条

最新专题

热议联想

点击排行

  • 两日热点
  • 一周热点
  • 一月热点
  • 心情
  1. 普京刚走,沙特王子便坠机身亡
  2. 李昌平:县乡村最大的问题是:官越来越多,员越来越少!
  3. 读卫茂华文章:“联想柳传志事件”大讨论没有结果,不能划句号
  4. 朝鲜领导落泪
  5. 11月CPI又降了
  6. 紫虬:从通钢、联想到华为,平等的颠覆与柳暗花明
  7. 宋江的遭遇与奴才的下场
  8. 历史的“魔镜”
  9. 天眸|人民正在期待 ——“第一主人公”毛主席的影视
  10. 李光满:从刀郎看中国文人的风骨
  1. 这轮房价下跌的影响,也许远远超过你的想象
  2. 胡锡进爆出了一个“惊天秘密”?问是谁™造就的胡锡进这类的“共产党员”,真是可耻!
  3. 判处死刑,立即执行,难吗?
  4. 颜宁女士当选中科院院士或弊大于利
  5. 普京刚走,沙特王子便坠机身亡
  6. 李昌平:我的困惑(一)
  7. 送完一万亿,再送一万亿?
  8. 不顾中国警告,拜登出尔反尔,解放军发出最强音:绝不手软!
  9. 又一处敬立毛主席塑像,各地纪念活动越来越多
  10. 司马南|南京市政府通告里面没讲的内容
  1. 张勤德:坚决打好清算胡锡进们的反毛言行这一仗
  2. 郭建波:《文革论》第一卷《文革溯源》(中册)论无产阶级专政下继续革命的理论和文化大革命
  3. 郝贵生|如何科学认识毛主席的晚年实践活动? ——纪念130周年
  4. 吴铭|这件事,我理解不了
  5. 今天,我们遭遇致命一击!
  6. 不搞清官贪官,搞文化大革命
  7. 三大神药谎言被全面揭穿!“吸血鬼”病毒出现!面对发烧我们怎么办?
  8. 10亿巨贪不死,谁死?
  9. 尹国明:胡锡进先生,我知道这次你很急
  10. 说“胡汉三回来了”,为什么有人却急眼了?
  1. 难忘的伟人 永恒的颂歌
  2. 这轮房价下跌的影响,也许远远超过你的想象
  3. 《决裂》:我们到底要与谁决裂?
  4. 不顾中国警告,拜登出尔反尔,解放军发出最强音:绝不手软!
  5. 北国的黯然曙光
  6. 《邓选》学习 (七)
Baidu
map