6月28日,通信互联盛会MWC(世界移动通信大会)上海在上海新国际博览中心开幕,这也是MWC上海十周年。
除了5G以及5G演进等移动通信技术趋势外,当下人工智能、AIGC大模型是行业关注热点也在展会得到了体现,这些应用都需要强大算力底座。本届MWC云集了联想集团、新华三、中国信科等厂商,他们推出了搭载英伟达GPU的AI高端服务器,华为鲲鹏、海光、飞腾等本土芯片的产品也在不断丰富。
今年以来,以ChatGPT为首的生成式AI被认为是人工智能领域的重大突破和方向。但千亿级参数的大模型又需要强大的算力基础设施来提供支持。AI算力紧缺,尤其英伟达芯片供应成为各界都在关注的话题。
(资料图片)
联想集团展台上在重点位置展出了搭载了英伟达A800芯片的高端服务器,这台能插八张GPU的服务器只插了两张。
“这个挺贵的,一张需要10万左右,所以我们只插了两张。一台服务器得卖100多万元。”联想展台上一位工作人员介绍,目前这款服务器供应还是非常紧张,现在下单需要10个月左右才能有货。
据了解,这款名为联想SR670V2的AI服务器主要提供给大模型厂商使用。
在打造算力底座方面,联想展出了AI服务器、分布式存储、高性能计算等智能基础设施。在分布式存储展台,联想工作人员介绍称,联想对本土CPU芯片海光、飞腾都有支持,也推出了存储产品。
新华三的展台展出了一台搭载英伟达H800高端芯片的高端服务器,这台插了八张H800芯片的服务器售价高达200万以上。
新华三集团副总裁、运营商事业部总经理何宁接受澎湃新闻记者采访也表示,搭载英伟达芯片的高端服务器供应还是非常紧张的,供货周期在30周左右。
不过,何宁也表示,算力从近期供应上确实比较紧张,但从长远来看算力肯定是过剩的,国内的寒武纪、昇腾这些GPU厂商能力上来后,算力会处于供过于求的状态,到时候国内市场肯定养不活这些厂商,需要向海外市场扩展。
一方面AI服务器缺货,另一方面传统服务器需求下滑,这使得一些服务器厂商的业绩受到影响。
日前,浪潮信息(000977)公告,受通用服务器客户需求节奏变化、全球GPU及相关专用芯片供应紧张等因素的影响,公司半年度经营业绩较上年同期存在下降的风险。
上述联想展台工作人员表示,对购买服务器的企业用户来讲,今年投资重点用来买了AI服务器了,传统的服务器基本上就暂停更换了,需要等一等。
不过,新华三展台的一位产品经理则表示,传统服务器需求不是暂停而是需求减少了,像一些互联网大厂由于自身业务的调整,对传统服务器需求在下滑,这部分需求未来不一定会回来。
与此同时,本土算力产品正在逐渐丰富。华为在展台展出了鲲鹏生态合作伙伴多款服务器整机,包括宝德、长虹、新华三等。鲲鹏是华为基于ARM架构开发的服务器芯片。此外,华为昇腾芯片计算平台也展出了中心训练芯片、中心推理芯片和边缘推理芯片。
联想和新华三的工作人员均表示,近年国产芯片的服务器、存储等产品需求稳定增长,政务、金融等对信息安全比较高的行业尤其明显。
一家服务于运营商的软件和信息服务厂商技术人士对澎湃新闻记者表示,东数西算在全国布局了多个数据节点,从算力上应该是够了,如何调度使用好才是关键。
“比如说你用电,你不会想去了解这是水电还是风电,还是太阳能,但我们算力现在大家还会去了解这是什么哪家的产品,用什么架构?未来算力也会这样,你在什么位置,需要多大算力,系统里自动给你最经济的配置方案,这需要超强的感知能力,比如有些科研机构的算力,相当长时间是闲置的,这些算力联网后可以提供出来给大家用。这些工作在某些区域或者某些细分领域开始尝试去做。”这位厂商人士说道。
标签: