算力军备竞赛国产GPU发起冲锋

2023-06-19 16:01:36 来源：腾讯网

集微网报道（文/李映）由ChatGPT引发的算力军备竞赛已悄然而至，在这场大模型引发的算力军备竞赛当中，GPU已成为整个行业的新焦点。在生成式AI开创的黄金时代，GPU将犹如翱翔于浩渺天空的翅膀，赋予AI大模型行业强大的推进力。

在这一场新的军备赛中，英伟达一骑绝尘，AMD紧随其后，英特尔虎视眈眈，而国产GPU厂商在经过AI的洗礼之后，加之国产替代紧迫的“引力”，不能更不应缺席这场“盛宴”。

尽管高端芯片的突围实非易事，但国产GPU能否好风凭借力，率先打破藩篱？

(资料图片仅供参考)

满足通用易用好用功能

或许，这先要从底层明了真正支撑大模型的算力需求。

天数智芯产品线邹翾表示，这要从模型和算法需求来入手，一是大模型的起点仍是小模型算法模块，针对这些模块要尽可能复用和可调试，实现兼容；二是随着参数量不断提升，GPU框架层对于大模型的拆解要考虑各种并行方式，包括计算、存储、通信的拆分；三是当多个GPU卡互联之后，出现了新的算子，需基于底层灵活的通用指令集支撑算子的调优。

考虑到这些需求，邹翾认为，GPU要满足三大要素：一是通用，可支持模型的快速变形、快速支持新算子、快速支持新通信；二是易用，可利用现有算法模块实现、调优经验可借鉴；三是好用，可重构并行计算、访存全交换、计算全互联。

实现这三大要素，背后还隐藏着芯片业运行的底层逻辑：GPU在前期巨大研发投入之后可大规模量产，具备搭建与主流兼容的生态，并使得软硬一体产品化在垂直应用中落地走向正反馈。

除这些“硬指标”之外，为满足训练集群成千上万张卡连续工作且不出故障，邹翾进一步提到，这对产品稳定性和可靠性产生极严格的要求。同时，还要支持可扩展的弹性能力，实现算力弹性可扩容。此外，还要提供坚实的保障，在故障出现时能迅速定位并快速恢复。

从国内GPU整体现状来看，与国外巨头的差距依然横亘，但经过前几年AI市场的淬炼之后，已然实现了国产通用GPU从0到1的突破，达到可用的程度。

值得一提的是，为全面助力大模型的发展，天数智芯还围绕底层技术支撑做了大量功课。邹翾介绍说，一方面天数智芯将通过最大化数据复用、可扩展大矩阵计算和存算异步、混合精度Transformer加速、高效高带宽显存及P2P等方式来提升芯片性能。另一方面，持续在基础软件方面提升实力，在支持前沿大模型、支持混合并行策略、支持新型Att加速、兼容APIs支持模型压缩等轻量化部署等层面布局。

进一步来看，应用落地是提升国产GPU实力的最佳“试验田”。邹翾提及，一方面，GPU从可用到好用还需要技术和时间积累，需要积累口碑、扩大品牌效应。另一方面，国产GPU可着力应用落地，加大与客户合作力度，在打开局面之后再逐渐扩大领地。

路径要小步快跑

要在应用中加快落地，生态是绕不过的“坎”。

目前在AI大模型领域，不仅要兼容主流生态，还要适配支持更高效、更复杂算法的大模型。

着眼于此，天数智芯率先布局，通过对高效Tensor引擎和可编程的GPGPU引擎的有机配合,硬件直接兼容主流生态，解决了通用性和高效率的双重难题。在获得量产和生态的“敲门砖”之后，天数智芯在生态层面的“朋友圈”也在持续扩大。

据介绍，天数智芯的通用GPU产品天垓、智铠系列具有高性能、广通用、开发成本低的特点，广泛支持DeepSpeed、Colossal、BM Train等各种大模型框架，基于其构成的算力集群方案不仅能够有效支持LLaMa、GPT-2、CPM、GLM等主流AIGC大模型的Pretrain和Finetune，还适配了清华、智源、复旦等在内的国内多个研究机构的开源项目，可以为行业伙伴提供一站式的大模型算力及赋能服务。

一系列的合作项目也捷报频传。日前天数智芯就宣布其天垓100加速卡算力集群，基于北京智源人工智能研究院70亿参数的Aquila语言基础模型，使用代码数据进行继续训练，稳定运行19天，模型收敛效果符合预期，证明天数智芯有支持百亿级参数大模型训练的能力。

前段时间，天数智芯通用GPU天垓100与飞桨已完成III级兼容性测试。测试结果显示，双方兼容性表现良好，整体运行稳定，这也是天数智芯加入“飞桨硬件生态共创计划”后的阶段性成果。

而从进阶路径来看，不能过于求大求快，而要由小及大、小步快跑。邹翾表示，国产GPU厂商可从几十上百个卡集群的推理任务入手，相比性能层面与国外产品基本持平，然后在此基础上再逐步拓展，扩展到上千或上万个卡集群，以时间换空间。

“中国在应用场景上有着自己独特的优势，很多国内头部企业也正在思考如何让大模型更好的运用起来，创造出类似“新四大发明”的独特应用，实现原生技术的通用性。”邹翾进一步建议，“因此，底层技术与市场差异化的融合将成为关键，需要国家的机制引领，以及产业链的协同创新，以共同推动全国产化进程。”

对于市场的破局，邹翾满怀信心表示，随着时间的推移，国产GPU性能不断攀升、应用全面开花，有望在5~10年实现追赶。

系统层面加以优化

随着一个个大模型相继落地，基于Transformer结构的大模型由于训练参数量级的增长致使计算需求亦量级增长，算力需求的缺口在不断扩大。

对于如何填补“缺口”的问题，邹翾从短期和长期进行了深入分析。

“对头部企业来说，早期的GPT大模型大概需要1万张的英伟达GPU，但迭代的大模型或至少需要数千张最先进的GPU才能完成。随着这一领域出现众多的跟随者，对于跟随企业来说，势必要在算力上不能输于头部企业，甚至还要进行更多的算力基础设施投资才能实现追赶。”邹翾指出，“而且现在主流产品已难以购买，算力是否充足将决定各公司大模型产品的成败。”

但从长期趋势来看，邹翾认为，现在业界掀起了百模大战，因业界尚未将大模型的性能潜力全部挖掘出来，头部企业希望能够率先抓住制高点，于是不断调高通用大模型的参数以开发新功能。但随着大模型的不断迭代，最终不可能有那么多的算力投资都真正产生效益，最终要面临落地产生闭环的考验，在未来两年内或会分出胜负，许多重复性的投资会达到收敛阈值，这时的算力基础设施需求将更趋于理性。

由于应用的爆棚和算法的快速演进，可以看到，通用GPU市场需求仍将迎来爆发式增长。据VerifiedMarketResearch数据，2020年中国大陆的独立GPU市场规模为47.39亿美元，预计2027年将超过345.57亿美元。

为加快适应这一“加速度”，邹翾还强调，业界要从系统层面来加以优化：一是大模型八九成的参数难以激活，如何让算法更简化、更高效需要持续着力；二是若做好AI大模型的算力最低门槛是1万颗英伟达A100芯片，GPU不仅要实现高算力，同时功耗至关重要，集群散热方案也十分关键；三是成本，不仅要考量GPU成本，还要考量降低存储、互联成本以及整体部署和运维成本。

在经过多年耕耘之后，天数智芯已实现了新的突破，在应用层面正步步为营，巩固了新的阵地，也为未来的持续精进打下了坚实的基石。

随着大模型需求会持续走高，最后邹翾提到，天数智芯将持续自主开发好用易用的通用GPU，不断升级算力解决方案，适配支持更高效、更复杂算法的大模型，为我国大模型创新发展和应用落地提供更加坚实的算力支撑。

算力军备竞赛 国产GPU发起冲锋

湖北迎来入梅首场强降雨 启动防汛四级应急响应

湖北迎来入梅首场强降雨 启动防汛四级应急响应

算力军备竞赛 国产GPU发起冲锋

湖北迎来入梅首场强降雨 启动防汛四级应急响应

南充掀起青少年书画传习热潮 选拔活动火热进行

焦点快报!强化系统治理 优化营商环境

短线防风险29只股短期均线现死叉_世界时快讯

通讯！孝素什么时候喝效果最好（孝素什么时间喝减肥）

决赛名单新鲜出炉，看英语朗读者们共话亚残！_当前报道

天津雍阳中学2023年小升初招生计划+时间|每日讯息

铭瑄618大促销：主板显卡优惠多

北京市与盖茨基金会持续支持全球健康药物研发中心建设_全球要闻

港股概念追踪 | 首例脑机接口人体试验今年进行 脑机又踏出关键一步(附概念股)_时快讯

捷波朗推出Speak2 55中国版全向麦

当前看点!更好发挥货币政策效能（记者手记）

2023中国（上海）萱草文化节开幕

DP接口怎么接hdmi(dp接口怎么接电脑啊)

博时中证新能源ETF净值上涨1.03% 请保持关注

申裕斌逆转孙颖莎好友，夺得女单冠军，周启豪击败奥恰洛夫夺冠|焦点速读

每日速讯：工信部提出激励制造业企业向卓越质量攀升

天天看热讯：政策强信心、市场涌暖意 A股积极因素正在聚集

张雪峰：家里没矿，看到这个专业请“快跑”，别拿父母的钱打水漂 天天视讯

填字组词怎么填（填字组词）

外语程度如何_外语程度|焦点热讯

【全球新视野】导游学校的录取分数线（导游学校）

浙江杭州推动智能家居产业链提升——让家变得更“聪明”（经济新方位·衣食住行看转型）_全球速看料

【独家焦点】生死狙击提升战斗力_生死狙击冒险模式怎么快速提升战斗力

辟谣！广西来宾官方最新通报-每日播报

家长纳闷，“高马尾”在中学生里逐渐消失，“鲶鱼头”却依旧盛行

黄石市气象台发布暴雨黄色预警【III级/较重】【2023-06-18】

【全球报资讯】四川广安一小区堡坎垮塌，正紧急抢修

朝鲜小秘密，看看这16个地方，了解真实的朝鲜 天天观点

全球观察：鱼和熊掌它想兼得丨华为MateBook E 2023 二合一平板电脑

小猪佩奇全集汪汪队立大功（小猪佩奇全集）|新要闻

中国能源研究会常务理事李俊峰：做ESG最重要的条件就是要有可持续的增长

每日观点：@星空爱好者 济南这组“麦田银河图”请查收！

每日速讯：杨紫和范丞丞官宣恋情，太甜了！

女子团购西瓜被嘲讽，“便宜的东西就是不甜”，百果园：系误解，店员说的是不甜但价格便宜，很多人买-环球播资讯

世界信息:怎样使用群助手群发（怎样使用群助手群发微信）

中韩悦未来养老年金保险可靠吗？具体保障是什么？

日产GTR明明价格不菲，为何被称为“破日产”？答案扎心

俞敏洪：从未打算让孩子传承新东方事业

培育科创未来 高新实小学子走进农业科创园感受农业之光-天天快讯

朴海镇老婆的个人资料 朴海镇老婆|通讯

“来都要来了，就好好听听中国的话吧” 世界热门

传颂之物虚伪的假面动漫在线看_传颂之物 虚伪的假面 动漫

世界最资讯丨怎么重装ie 怎么重装ie

要闻速递：理想纯电新车定名 MEGA，定位超 50 万元，还把「ChatGPT」搬进了车里

世界热资讯！厦门军营村有什么好玩的？到军营村找高山迎服务平台进行游玩预定

世界快看点丨天玑8100+120赫兹变速高刷屏！一加 Ace 竞速版入手仅需1619元

世界讯息：最新通告！事关中考

ipad如何恢复出厂设置

东莞有哪些大学?（东莞有哪些大学）

有什么要什么_对于有什么要什么简单介绍

环球即时看！文字直播（文字直播有哪些

湖南启动防汛Ⅳ级应急响应，岳阳连发多条暴雨预警！_每日头条

作业指导书基本格式

起亚EV6将于6月份开启盲订 8月成都车展期间上市

国家医保局推出首批十六项医保服务便民措施-全球头条

热议：群龙取水最佳取水方法图示_群龙取水游戏规则

中国申请加入CPTPP最新进展：已对2300多项条款进行深入全面研究和评估|热议

世界快资讯丨湖南道县：“百龙出征”迎端午

偷越国(边) 境人员要如何量刑-全球今热点

环球热点评！气象行业标准汇编2007 关于气象行业标准汇编2007介绍

前沿热点：俄罗斯：黑海粮食协议下月到期后或退出

观速讯丨PGS2将会启用新地图泰戈，4AM有三个跳点可选，训练赛猛练Roll点

ipad无法检查更新检查软件更新时出错_ipad无法检查更新|当前视点

世界百事通！刘水：当前房企复牌面临哪些紧要任务？

红眼辅助装备打什么徽章_dnf红眼辅助装备打什么宝珠 全球头条

当前关注：怎样联系许家印（怎样联系许贺资料）

word个人简历表格怎么固定不变 word个人简历|当前热讯

头条焦点：雷竞技资讯：俱乐部偷换合同内容！Doinb老板公开Uzi被卡三年内幕

购房备案合同丢了怎么办

新动态：8位院士齐聚广州，吹响中医药高水平科技创新“集结号”

世界微资讯！福田汽车全系自动挡变速箱发布

股息红利税补缴什么意思（股息红利）

祝福语2021短句 焦点资讯

每日快讯!安卓手机怎么root教程（如何root安卓手机）

广东汕头：抢占数字经济赛道 发展前景可期 全球今热点

算力军备竞赛国产GPU发起冲锋

湖北迎来入梅首场强降雨启动防汛四级应急响应

湖北迎来入梅首场强降雨启动防汛四级应急响应

算力军备竞赛国产GPU发起冲锋

湖北迎来入梅首场强降雨启动防汛四级应急响应

南充掀起青少年书画传习热潮选拔活动火热进行

焦点快报!强化系统治理优化营商环境

港股概念追踪 | 首例脑机接口人体试验今年进行脑机又踏出关键一步(附概念股)_时快讯

张雪峰：家里没矿，看到这个专业请“快跑”，别拿父母的钱打水漂天天视讯

朝鲜小秘密，看看这16个地方，了解真实的朝鲜天天观点

每日观点：@星空爱好者济南这组“麦田银河图”请查收！

培育科创未来高新实小学子走进农业科创园感受农业之光-天天快讯

朴海镇老婆的个人资料朴海镇老婆|通讯

传颂之物虚伪的假面动漫在线看_传颂之物虚伪的假面动漫

红眼辅助装备打什么徽章_dnf红眼辅助装备打什么宝珠全球头条

祝福语2021短句焦点资讯

广东汕头：抢占数字经济赛道发展前景可期全球今热点

长城炮越野双雄王者焕新 23款越野炮&火炮正式上市全球今头条

今日快看!Haynes：快船队不太可能和泰伦-卢达成续约他预计执行完剩余合同

最高降6000元！捷豹新F-PACE售47.2万起造型升级

当前播报:重罚！莫兰特禁赛25场比赛：美记曝将损失千万活动也不能参与

全球快播：梦响海右赢在济南，济南首届海右人才节文艺汇演举办

【环球速看料】围堰成功封底广湛高铁佛山特大桥跨西江桥建设迎新阶段

世界今日报丨网络营销可以考哪些大学网络营销学校排名

真人电影《芭比》中国内地定档7月21日与北美同步上映 _世界简讯

能源价格持续下跌英国消费者通胀预期回落-最新快讯

讯息：财政部：1-5月全国一般公共预算收入99692亿元同比增长14.9%