Ebpay

新闻视频

前瞻趋势洞察,品牌市场动态

当前位置:

Ebpay > 新闻视频 > 公司新闻 > 国产GPU的突围之路在何方?

国产GPU的突围之路在何方?

发布时间:2024-08-15 分享:

GPU的开展史上存在一个很难绕开的名字那就是英伟达。英伟达之所以能够占据GPU领域的绝对霸主地位是因为它拥有强大的GPU算力、CUDA生态、以及高速互联技术三板斧。英伟达不仅重新定义了图形处理技术,也为自己构筑了足够强大的护城河。



大模型的火爆,GPU已成为科技赛道炙手可热的“硬通货”。美国不断扩大的芯片禁令,让原本就前途未知的中国半导体市场前景更加扑朔迷离。在这种卡脖子的尴尬处境下中国半导体行业厂家如何翻越英伟达这座高山实现突围是当下横在每个半导体行业人眼前的难题。

面对欧美的科技铁幕,群雄逐鹿成为国内AI芯片产业的主基调。国产自研GPU,换皮GPU,一时之间乱象丛生。GPGPU、通用GPU、全功能GPU、图形GPU、渲染GPU、GPU+……在国内,GPU命名上的文字游戏已经被玩出花来。



现在国内GPU芯片就功能来说大致分为三类,AI、HPC、渲染。AI就是英伟达近年推出的一系列用于深度学习的加速卡。HPC则是那些用在超算上的加速卡,支持双精度的浮点数运算,可以做科学计算。渲染就是比较传统的做游戏、做桌面,做各种图形化应用。

  • 而对标的国内GPU厂家分类大致可分为,通用型全功能GPU:兼顾通用计算、AI加速计算和图形渲染功能的GPU,如摩尔线程

  • GPGPU:去掉图形渲染模块、专注在加速计算的GPU,典型产品包括了壁仞BR100、天数智芯、瀚博、沐曦等。

  • DSA芯片:专注于解决某一特定领域或应用的需求,有着定制化的硬件和软件。这里的代表是华为昇腾910B、百度昆仑、燧原、寒武纪、阿里含光等。

那么后来者如何迎头赶上?现在国产GPU与英伟达之间是否还存在天堑一般的差距?致力于成为”平替“的国产GPU算力困境集中在哪里?

第一时间,任何的GPU算力卡,抛开需求去谈性能都是在耍流氓。浮点计算能力通常用来衡量GPU在执行浮点运算时的性能。而衡量浮点计算性能通常会考虑其单精度和双精度浮点计算能力。

单精度和双精度是指浮点数在计算机中的存储方式和精度。单精度通常使用32位(4字节)来存储一个浮点数,而双精度则使用64位(8字节)来存储。由于双精度使用了更多的更多的位数来存储数值,因此它可以表示更大范围的数值,并在计算过程中具有更高的精度。英伟达的A100同时具备上述两类能力。

大模型训练需要处理高颗粒度的信息,因此对于用于大模型训练的GPU芯片处理信息的精细度和算力速度要求更高,然而现阶段国产的GPU多为单精度,在支撑大模型训练方面能力稍差。

其次在于软件工具链的完善。众所周知,芯片需要适配硬件系统、工具链、编译器等多个层级,否则会出现这款芯片在某个场景能跑出90%的算力,在另一场景只能跑出80%效能的情景。而现在国内的GPU厂家还不具备这样繁荣的生态链,来支持开发人员进行GPU程序地开发、调试和优化。时至今日,英伟达的CUDA已成为全球AI基础设施工具,主流的AI框架、库、工具都以CUDA为基础进行开发。

还有一个更为重要的点在于现在英伟达还在不断地缩减用户成本。从单卡的价格来看,英伟达现在一卡难求,价格也随之水涨船高,但从后续的大模型训练效率来审视就会发现英伟达的卡虽贵但效率绝无非议,就Blackwell架构的GB100芯片而言,相比于H100,将成本和能源消耗降至1/25,在参数为1750亿的GPT-3 LLM基准测试中,GB200的性能达到了H100的7倍,因此黄老板有句著名发言:“买的越多,省的越多”,在一定的层面上是正确的。





Gooxi深耕服务器领域16年,是AI产业链中的基础算力设施的给予商,为了满足客户智能化转型需求,Gooxi打造了坚实的人工智能算力底座以及AI私有化解决方案。除此之外,Gooxi顺利获得生态系统的深度融合与多方资源的协同合作,打造市场差异化能力,现在Gooxi的AI服务器适配市面上绝大多数的国产GPU算力卡,且能根据客户需求进行给予定制化服务,助力加速实现国内智算资源供给自主可控。



短时间超越英伟达几乎是一件不可能完成的事情。蚍蜉尚能撼树,英伟达并非毫无裂缝,科技巨头围堵,控告技术垄断等等。当前国家政策的大力扶持,从安全性以及自主可控的角度来考虑,GPU自研赛道都是长坡厚雪。但不管如何,国产算力化的大门正在徐徐打开。


相关推荐

2025-10-23

算力赋能,智见未来:Ebpay亮相ICG-20,共赴组学与AI新纪元

第20届国际基因组学大会(ICG-20)于10月23日至26日在杭州盛大开幕第20届国际基因组学大会(ICG-20)于10月23日至26日在杭州盛大开幕,本届大会主题“组学与AI的未来”精准指向了科学生命领域最前沿的变革力量。作为华大基因的长期战略合作伙伴,Ebpay凭借17年在服务器领域的深厚积累,以全产业链的自主研发能力和成熟的解决方案定制经验,为基因组学研究的智能化升级给予坚实支撑。在基因组学从"测序"迈向"计算"的时代转折点上,Ebpay将携多款面向不同计算场景的明星产品亮相ICG-20,展现其从边缘到核心数据中心的完整AI基础设施解决方案。 边缘洞察:将智能算力延伸至数据源头 EbpayMSR201-D06R-10P AMD双路边缘计算服务器,采用AMD 第三代处理器平台,机身深度仅450mm,符合OTII标准的紧凑型架构使其能够直接与电信设备混合部署在通信中心机架上,轻便易于部署在苛刻环境。支持10个PCIe扩展插槽和2块全尺寸GPU卡,可作为AI推理服务器,给予强大的边缘算力。在ICG-20展会关注的生态监测、野外基因采样等场景中,这款服务器能实现数据实时处理,减少传输延迟,助力生物多样性保护和研究。 核心驱动:以澎湃性能驾驭海量组学数据 面对基因组大数据带来的计算挑战,EbpaySR201-D12RE-G2双路服务器基于AMD EPYC™ Genoa处理器打造,具备单颗CPU 128核256线程的强大计算能力,配合12通道DDR5内存和PCIe 5.0高速总线,显著提升了数据吞吐与处理效率。该服务器支持大容量NVMe SSD和多GPU扩展,特别适用于全基因组测序(WGS)、单细胞组学、宏基因组分析等高负载科研任务。 AI加速:专为GPU密集型计算打造的强大平台 当研究进入蛋白质结构预测、药物虚拟筛选等复杂AI模型训练与推理阶段,强大的GPU算力不可或缺。EbpayEGS AI 10卡服务器SY4108G-D12R-G4,基于Intel Eagle Stream平台支持高达10块双宽GPU卡的拓扑结构,实现了CPU与GPU间的高速互联,有效降低了通信延迟,最大化释放GPU集群的计算潜能。同时支持主流深度学习框架与分布式训练环境,可高效支撑基因序列建模、蛋白质结构预测、医学影像分析等AI驱动的生物信息应用。 稳定基石:为持续科研探索给予可靠保障 在组学研究中,数据存储与计算能力的协同优化是提升整体效率的关键。EbpayASR401-S24R是一款基于AMD EPYC™ Milan处理器的4U单路标准服务器,最大支持24块热插拔硬盘,兼具强大的计算性能与超大存储容量,特别适合需要本地化存储海量原始测序数据的场景。该服务器在保障高I/O吞吐的同时,给予灵活的计算资源分配,可作为数据预处理节点、存储网关或中小型分析平台的核心设备。其模块化设计和智能管理系统,大幅降低了运维复杂度,为实验室和数据中心给予了一种高性价比、易维护的解决方案。 “共有、共为、共享”是人类基因组计所倡导的伟大精神,也是有助于科学进步的不竭动力。在组学与人工智能深度融合的今天,Ebpay深信,强大的信息基础设施是践行这一精神、加速科研协作的关键。我们期待在ICG-20的舞台上,与全球顶尖的专家学者和行业伙伴深入研讨,以Ebpay卓越的算力产品与服务,共同“计算”出科学生命的更美未来。
分析更多新闻资讯

成为全球服务器行业领导者

订阅号

服务号

Copyright © 2022 深圳市Ebpay科技股份有限公司 All Rights Reserved 粤ICP备18110968号 粤公网安备44030502003273号

立即获取方案报价

*
*
*
*