搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

海光CPU创始人唐志敏:异构计算已成必然,软件决定芯片胜负丨GAIR 2025

2025-12-24 06:49:12
来源:

猫眼电影

作者:

安吉文

手机查看

  猫眼电影记者 刘某某 报道首次登录送91元红包

“RISC-V具备一定的包容性,有机会融合 CPU、GPU 和 AI 处理器的特性,突破 CUDA 的生态壁垒。”

作者丨包永刚

编辑丨林觉民

2025年12月12-13日,第八届GAIR全球人工智能与机器人大会在深圳·博林天瑞喜来登酒店正式启幕。

作为AI 产学研投界的标杆盛会,GAIR自2016年创办以来,始终坚守“传承+创新”内核,始终致力于连接技术前沿与产业实践。

在人工智能逐步成为国家竞争核心变量的当下,算力正以前所未有的速度重塑技术路径与产业结构。13日举办的「AI 算力新十年」专场聚焦智能体系的底层核心——算力,从架构演进、生态构建到产业化落地展开系统讨论,试图为未来十年的中国AI产业,厘清关键变量与发展方向。

深圳理工大学算力微电子学院院长、龙芯 CPU 与海光 CPU 创始人唐志敏发表了题为《XPU的未来——软件决定成败》的主题演讲。

唐老师指出,算力不仅是硬件性能的体现,更是一种在资源与时间约束下完成任务的能力体系。在这一背景下,训力、推力等新型算力能力正在逐步形成,推动人工智能从语言理解向多模态生成发展。

他强调,随着生成式 AI 对算力需求的快速增长,单靠 CPU 已无法满足现实需求,异构计算(CPU+XPU)成为必然选择。但硬件本身并非决定因素,真正影响算力释放的,是软件与应用生态。他通过对x86、Arm和RISC-V的分析,指出生态惯性和软件兼容性在商业化和技术落地中起到决定性作用,生态成熟度往往比硬件性能更能决定芯片成败。

唐志敏也强调,软件定义一切,这不仅意味着应用开发与性能优化,更决定了算力芯片的长期竞争力和产业格局。

在算力体系演进中,硬件是基础,但软件和生态才是真正的“决定因素”。无论是 CPU、GPU 还是未来的 XPU,掌握和构建完整的软件生态,才能在高速增长的算力需求与复杂的技术挑战中立于不败之地。

精彩演讲回顾

演讲完整视频,详见链接:https://youtu.be/m47Dd5rJisw

以下为唐志敏老师的精彩演讲内容,雷峰网作了不改变原意的整理与编辑:

从“算力”到 Computility:算力正在被重新定义

“算力”其实是中国人自己创造出来的一个词。以前在计算机领域,更多讲的是performance(性能),而不是算力。中国人什么事情都喜欢讲“力”,比如体力、臂力、脑力,现在又有了算力。

既然是我们自己创造的词,那怎么翻译成英文?有人翻成Computing Power,但这个词我觉得不太好,听起来就很费电,现在的算力确实费电,但我们并不希望算力特别“更费电”。

所以有计算所的老师创造了一个新词,叫Computility,把Compute(计算)和Utility(设置)合在一起,我个人是比较认同这个说法的。我们希望算力像水、电一样,成为一种基础设施。

实际上算力就是:在可接受的资源、可接受的时间内,完成某种计算任务的能力。

在算力这个概念之上,最近几年又出现了很多新的“力”。比如现在大家讲得比较多的:

训力,就是快速训练出大模型的能力;

推力,就是基于大模型快速推理、生成结果的能力。

未来还可能会有什么力?我自己也做过一些畅想。现在的大模型已经可以理解语言,也可以生成视频,GPU 可以渲染高度逼真的图形。如果把这些能力结合起来,也许有一天,我们可以把小说直接“演”成电视剧。这种能力,本质上还是算力体系不断演进的结果。

CPU 不能满足需求,异构计算成为必然选择

各种各样的计算芯片,是算力的基础。我原来是做高性能计算机体系结构,后来进入半导体行业,会发现处理器和其它很多芯片并不一样。处理器不是一个单纯的硬件,它最复杂的地方在于,要支撑运行非常复杂、规模巨大的软件系统,所以出现了“软件定义一切”的概念,比如软件定义存储,软件定义网络,软件定义无线电。

虽然摩尔定律逐渐放缓,但算力需求,尤其是生成式人工智能对算力的需求,却在持续快速增长,而且增长速度远远超过了制程和工艺所能带来的性能提升。

在这种情况下,只靠CPU肯定不能满足对算力的需求。CPU的主频和整体架构,二十多年里并没有发生本质变化,所以我们只能通过CPU + XPU的方式,比如CPU+GPGPU,或者其他的PU,总称为XPU,和CPU形成异构计算架构,在通用性、性能、能耗和成本之间寻找平衡。

XPU 的本质:硬件只是资源,性能取决于软件

但异构计算带来了编程、软件兼容性两大难题:

编程变得更加困难;

原来只在CPU上运行的程序,如今要分为两部分,一部分仍在CPU上,另一部分放到XPU上运行。

从计算机体系结构的角度看,我习惯把架构分成三类。

第一类是比较激进的结构,主要靠硬件做动态优化。为了运行复杂应用,硬件要分析指令之间的并行性,典型代表就是传统 CPU。

第二类是比较保守的结构,硬件并不去做复杂分析,而是提供大量运算部件和存储资源,至于这些资源怎么用,主要依赖软件,比如GPU和各种XPU。

第三类是动静态优化相结合的结构。

XPU本质上属于保守型结构。硬件只负责把计算资源提供出来,并不保证性能一定能发挥出来。性能能不能出来,更多取决于软件、编译器和程序员。

自动并行化这个方向,学术界和工业界研究了几十年,效果始终有限。现实中,真正能把性能跑出来的,还是依赖经验丰富的程序员和成熟的软件体系。

也正因为这样,我一直强调,算力芯片真正面临的核心问题,不是硬件架构,而是应用生态。

所谓生态,就是能在处理器上运行的所有软件的总和,包括应用软件、操作系统、编译器、中间件、函数库和开发工具。最终真正产生生产力的,是应用软件,而不是芯片本身。

生态惯性:x86、Arm与RISC-V的现实边界

在CPU领域,x86生态经过四五十年的发展,已经有非常高的市场占有率和生态惯性。哪怕是英特尔自己,也很难去推动一个不兼容x86的体系。

根据Gartner给出的全球企业软件的情况,经过多年发展,x86软件市场越来越大,基于x86软件的销售收入是3000多亿美元。为x86开发软件的费用,每年大概是600亿美元。而全球服务器市场总的收入,大概是800亿美元。也就是说,一年卖出800亿美元的服务器,为了开发x86软件,每年要新增600亿美元。可见软件开发需要耗费大量精力。

在手机领域很成功的Arm也想要进入服务器领域,可以看到一个又一个Arm架构服务器公司屡战屡败。他们的失败有各种各样的原因,我认为Arm架构在服务器领域要成功需要有两个原因:一个原因是掌握全栈技术的大公司不再使用x86,这是Arm的机会,典型的比如苹果不用x86,自己掌握软件栈可以切换。另一个原因是端云融合,手机上和云端都用Arm架构,这样手机上的应用比较容易迁移到云端,包括云游戏等,这样Arm在服务器市场才更容易成功。

除了Arm,RISC-V也是一个大家都在关注的方向,但RISC-V到底灵不灵?它的开放性确实带来了新的可能性,但开放和开源本身,并不自动等于成功,开放的CPU有很多,比如OpenRISC、OpenSPARC、OpenPower现在也开放了。

也有人说Arm太贵,用RISC-V可以省钱。但我之前做芯片公司的时候,一直买Arm的IP授权,也没觉得有多贵。若干年前,Arm一年的收入十几亿美元,如今Arm每年收入三四十亿美元,Arm收入的增加是在很多公司使用RISC-V的背景下,这从某个角度说明了做RISC-V的公司需要反思。

还有人说RISC-V更适合做研究,因为可以随便修改。但我认为做研究用什么架构都可以,不一定要用RISC-V,用x86、Arm照样可以做研究,这不是理由。

RISC-V开放,很多人希望用开源硬件去走一条类似开源软件的发展路径,但我一直觉得,这条路并没有那么容易。和开源软件相比,开源硬件的难度要大得多。

从现实情况看,现在全球的 RISC-V 都面临着商业化的困难。我看到一条新闻,Jim Keller——这个行业里做CPU架构的顶级人物——创办了一家做RISC-V的公司Tenstorrent,最近开始裁员了。包括Tenstorrent在内美国好几家公司做出了RISC-V芯片,但问题是不知道卖给谁。

目前相对做得好一些的,反而是一些软件相对简单的嵌入式场景,比如做存储的企业,把 RISC-V 用来做存储控制器。这类场景软件非常简单,确实能用,也用得不错。但一旦进入计算领域RISC-V面临的问题就多了很多。

这背后反映的,不只是软件生态的问题,硬件生态本身也还不成熟。只要是 CPU,就一定会走向多核,多核就涉及片上互联网络,Arm在片上互联这件事上,已经有比较成熟的解决方案,但RISC-V还没有。

于是就出现一种很现实的困境:想做RISC-V CPU,但片上互联又要去找Arm买。Arm愿意把互联网络卖给你,也想顺便把CPU核一起卖给你。这就是RISC-V目前在工程层面面临的实际困难,也说明还有很长的路要走。

为什么兼容 CUDA 容易,复制 CUDA 生态极难?

也有人认为,将来指令系统可能没那么重要,因为现在是“软件定义一切”,上层可以用 Python、Java 这些平台无关的高级语言。但从实际发展来看,情况并不是这样。以Intel为例,无论是过去的AVX-512、SGX,还是现在围绕人工智能不断加入的新指令,都说明:硬件指令的直接支持,对性能和能效始终是有价值的。

在XPU领域也是类似的情况。现在大家都在讲兼容 CUDA,因为 CUDA 的生态确实做得好。很多做其他XPU、AI加速器的厂商,第一件事就是要兼容CUDA。

但 CUDA本质上是什么?它其实就是一个高级语言接口,是英伟达的一套API。从技术角度看,兼容一个API并不难,有一个编译器,就可以兼容CUDA的接口。但真正难的,是兼容 CUDA 背后的软件生态。

生态从来不只是一个 API,它包含了大量算力库、函数库、开发工具和工程实践,这是一套非常复杂、长期演进的体系,工作量极其庞大。

也正因为如此,现在国家层面也意识到这个问题的重要性,正在推动大家一起做生态建设。从这个角度看,打造我们自己的算力生态是非常有必要的。除了CUDA,英特尔、AMD 也都在做各自的生态,我们如果不做,就永远受制于人。

谁能把芯片做成?软件生态决定成败

从整体来看,我们现在的算力体系仍然存在不小的缺口和瓶颈。中国乃至全球范围内,半导体的发展速度都在放慢,但算力需求却在持续增加。中国还面临制程方面的限制,这就决定了我们必须通过跨学科交叉,在系统、软件和算法层面,去寻找实际性能的突破。

算力的发挥,靠的不只是硬件。硬件当然是基础,但硬件的峰值性能,本质上只是一个指标。真正的性能提升,很大一部分来自软件优化。

做高性能计算的人都知道,LINPACK可以把整机效率跑到60%~70%,但LINPACK只是测试程序,不是真实应用。真正的应用软件,能跑到整机20%~30%的效率已经非常不容易。这里面还有很大的优化空间。

我们的芯片峰值性能可能很难做到最高,但如果能打破硬件和软件之间的隔阂,在软件、编译、系统层面多做一些优化,即便在峰值性能相对低一些的芯片上,也完全有可能获得不错的应用效果。这是未来非常重要的一项工作。

另外,现在大家都在做 GPGPU,但GPU最基本的能力同样重要,比如纹理生成、图案着色、光照和阴影处理等。现在有些GPGPU已经发生了“异化”,只能计算,不能渲染。但如果我们真的要实现从小说生成电视剧,不仅需要 GPGPU 的计算能力,也同样需要GPU的图形渲染能力。AIGC不只是生成文章,还应该能生成影视内容。

计算芯片产业的发展,本身是一个螺旋式上升的过程。早期系统厂商都会自己做CPU,因为 CPU是计算机系统的核心;后来由于量产和成本压力,x86快速发展,系统厂商逐步退出;而现在,系统厂商和平台厂商又重新开始自研芯片。

美国的互联网巨头如此,中国的互联网厂商、系统厂商也都在自研CPU。自研自用这条路能不能走通,关键并不在于“能不能做芯片”,而在于:能否为产品和服务提供足够大的增值,能否掌控全栈软件体系。

苹果是一个非常典型的成功案例。从跟摩托罗拉和IBM联合开发PowerPC CPU,到转向采用Intel CPU,再到基于Arm架构自研CPU,它之所以能成功,原因其实非常简单:通过自研高性能芯片,配合自有的软件体系,形成非常领先的用户体验,在此基础上把产品卖得很贵。手机卖得贵,笔记本也卖得贵。其它厂商如果做不到这一点,仅仅自研芯片,最终大概率都会失败。只有软硬件通吃,才能真正卖得贵。

我们要不要再搞新的指令系统?我个人的看法是:架构创新不需要依赖新的指令系统。指令系统只是硬件和软件之间交流的语言,我们没必要不断增加新的语言。如果要做创新,在现有指令体系下完全可以做,RISC-V 已经足够了。

归根结底,谁能把芯片做成功?不管是CPU还是GPU,只有真正重视软件和应用生态,才有成功的可能。“软件定义一切”,这个“一切”,同样包括成功和失败。

对于平台厂商和系统厂商来说,如果要自研芯片,一定要有清晰的差异化,并且这个差异化必须能为系统或服务带来显著增值,否则使用成熟的商用芯片,反而是更理性的选择。

最后我还是希望,大家能把RISC-V作为一个统一的指令系统方向。无论是CPU、GPU还是其他处理器,都尽量统一到同一架构平台上,减少重复投入。

我们常说“三国定律”,合久必分,分久必合。过去是CPU为中心,现在是CPU + XPU的异构体系,未来也许会回到以CPU为中心的新一体化架构。RISC-V具备一定的包容性,有机会融合 CPU、GPU 和 AI 处理器的特性,吸收开源体系的力量,逐步突破 CUDA 的生态壁垒。

以上就是我全部的分享,谢谢大家。

 时事1:世界杯球赛怎么买球

  12月24日,青藏高原隆升何以造就烟雨江南?中国团队最新研究揭晓答案,《每日经济新闻》记者注意到,这是继2024年底成功引入德国安联为战略投资人之后,国民养老保险第二次进行增资扩股。若本次增资扩股能成功实施,国民养老保险资本实力将进一步增强,或将重回国内养老保险公司注册资本规模第一的位置。,老虎机漏洞。

  12月24日,上剧场迎来十周年 赖声川经典剧目演出千余场,最后打个广告:希望我们金证股份、钐烽科技能为在座各位的数字化转型,尤其是业务转型,贡献科技赋能的力量。我们是一家科技公司,参加这次论坛也希望与更多朋友进行同业交流,为大家穿针引线。无论是金租还是商租,我们都希望进行行业交流,谢谢大家!,综合体育平台登录入口,m6米乐快速开户,百老汇真人游戏。

 时事2:大赢家即时比分90

  12月24日,李家超参与香港特区立法会选举投票:希望和议员一起商议火灾善后重建工作,据香港大公文汇全媒体12日报道,香港特别行政区行政长官李家超今日(12日)赴北京,将列席第十四届全国人民代表大会第一次会议闭幕会。针对香港男子冰球代表队2月28日在世界冰球锦标赛第三级别比赛,主办方赛后播国歌时出错事件,李家超今日在机场会见记者时表示,国歌代表民族尊严、国家尊严,将竭尽一切所能,确保国歌在不同场合正确播出。,引人入胜A(新图),澳门各大游戏网站,金沙银河官网。

  12月24日,赛场内外的别样温情——残特奥会江门赛区见闻,左凤高还在陈方清之后短暂担任过信达财险董事长。2013年,原保监会批复了左凤高信达财险董事长任职资格。不过其任职时间较短,2014年12月徐兴建获监管批准,担任信达财险董事长。,澳门人威尼斯4399,九州体育平台首页,游戏平台网址大全。

 时事3:世界杯买球地址伽fc3_tv

  12月24日,湖北武汉:越冬红嘴鸥化身“冬日舞者”与人同游,主要资产管理公司的基础设施和房地产部门,如Blackstone和Brookfield,近年来已显著增加了对数据中心资产的敞口。据美国房地产投资信托基金协会数据,上市房地产公司在2024年将数据中心投资增加了15%,同时缩减了对写字楼和公寓等传统领域的投资。私人资本同样在跟进,CBRE对92家主要投资者(包括私募股权和养老基金)的调查显示,95%的受访者计划增加对数据中心的投资。,乐动体育登录地址,纳米体育平台,水果阿姨内幕。

  12月24日,无人机群飞行规划员 职业更新拓就业空间,这段视频发布于3月17日,视频中的女孩是四川眉山市的一位初二学生,教育女孩的便是自称为资深家庭教育专家的赵菊英。有网友指出,在赵菊英家访这一女孩的过程中,女孩对待赵菊英的眼神从最初的爱笑有光,到最后变成了愤恨无神。,美高梅所有平台网址,三公扑克,万博网址在哪找。

 时事4:ror体育平台官网

  12月24日,最高法与全国妇联联合印发通知 推进婚姻家庭纠纷预防化解,施正文表示,此次关税法制定一大原则就是提升关税征管便利化水平,因此确定了关税征收管理可以实施货物放行与税额确定相分离的模式。比如,进口货物关税确认需要一段时间,要明确原产地、货物估价等。如果等缴完税再放行,影响通关便利。因此,目前采取了货物放行与税额确定相分离的模式,即根据企业申报纳税情况先发行,后审核纳税,提升通关速度,以促进对外贸易。,ONE体育,皇宫备用网址,PG电子游戏免费试玩。

  12月24日,世界杯云顶站谷爱凌三连冠,汪绪良向村里申诉后,村委会帮忙去镇工商所注销了汪绪良的工商信息。但2023年,汪争猛的母亲赵和梅做心脏搭桥手术花了20多万,家里想申请重大疾病补助金,到村委会申请时,又发现“家里有营业执照”,不符合条件。,疯狂捕鱼无限金币版破解版,尊龙凯时平台登录,美狮MGM官网。

责编:王汉军

审核:谢尔盖·拉夫罗夫

责编:王秋鳗

相关推荐 换一换