当前位置:首页 → 电脑软件 → 泽连斯基怒斥普京血腥进攻 → 新濠天地官網 v8.948 安卓免费版
v1.498.8009.960294 安卓最新版
v1.276.6633.206448 IOS版
v7.573.1210.982933 最新版
v8.248.6193.226893 安卓版
v5.129.44 安卓版
v9.235.9803 安卓汉化版
v1.799 IOS版
v9.329 安卓版
v8.607.8277 PC版
v8.931 IOS版
v9.968.8157.956307 IOS版
v8.871 IOS版
v9.440.6696 安卓汉化版
v2.711 IOS版
v5.328.3613.591210 IOS版
v2.847.1413.381022 IOS版
v2.699.1537.517852 IOS版
v4.208.5565.426086 安卓版
v7.7 最新版
v9.796 安卓汉化版
v3.123 安卓汉化版
v3.949.4778 安卓最新版
v5.233.9872.526112 安卓版
v9.707 IOS版
v1.110 安卓最新版
v8.30.4951.293636 IOS版
v9.721.5083 安卓最新版
v6.657.8955.102459 IOS版
v1.79 安卓版
v5.706 安卓最新版
v2.626.8134 安卓版
v9.500 IOS版
v4.691.8825.269720 安卓汉化版
v2.685 PC版
v5.252 PC版
v1.157.8758.905857 安卓免费版
v4.812.5797.234233 安卓免费版
v5.579.9628 安卓免费版
v4.274.9092 安卓最新版
v9.901 安卓汉化版
v3.139.6536 PC版
v1.762.1249.815800 IOS版
v2.617.3183 最新版
v4.457.1459 安卓汉化版
v7.610.195.594938 安卓免费版
v8.406 最新版
v7.709 IOS版
v2.805 最新版
v9.813 安卓最新版
v7.597 PC版
v4.841.2935.351321 安卓免费版
v8.322.2665.441812 安卓版
v1.429 安卓最新版
v7.956.5171 安卓免费版
v8.937.6200.879359 IOS版
v3.476 PC版
v1.747 最新版
v3.693.6013 最新版
v2.310.1276 PC版
v4.684.4983 PC版
v4.432.5338 安卓版
v2.793 安卓最新版
v4.525.7631.488457 IOS版
v1.334.1167 PC版
v7.326.8015.618405 安卓版
v7.618 安卓汉化版
v5.893.5758.426635 安卓免费版
v4.548 PC版
v9.907 IOS版
v2.626 安卓版
v2.576 安卓版
v3.501.2696.125257 安卓版
v3.838.2161.421566 安卓版
v3.454.3315.852889 最新版
v7.698 IOS版
v7.462 IOS版
v7.171.9821.273406 安卓版
v9.611.1368.867287 最新版
v9.52.1130 IOS版
v3.24.1234 安卓汉化版
新濠天地官網
“RISC-V具备一定的包容性,有机会融合 CPU、GPU 和 AI 处理器的特性,突破 CUDA 的生态壁垒。”
作者丨包永刚
编辑丨林觉民
2025年12月12-13日,第八届GAIR全球人工智能与机器人大会在深圳·博林天瑞喜来登酒店正式启幕。
作为AI 产学研投界的标杆盛会,GAIR自2016年创办以来,始终坚守“传承+创新”内核,始终致力于连接技术前沿与产业实践。
在人工智能逐步成为国家竞争核心变量的当下,算力正以前所未有的速度重塑技术路径与产业结构。13日举办的「AI 算力新十年」专场聚焦智能体系的底层核心——算力,从架构演进、生态构建到产业化落地展开系统讨论,试图为未来十年的中国AI产业,厘清关键变量与发展方向。
深圳理工大学算力微电子学院院长、龙芯 CPU 与海光 CPU 创始人唐志敏发表了题为《XPU的未来——软件决定成败》的主题演讲。
唐老师指出,算力不仅是硬件性能的体现,更是一种在资源与时间约束下完成任务的能力体系。在这一背景下,训力、推力等新型算力能力正在逐步形成,推动人工智能从语言理解向多模态生成发展。
他强调,随着生成式 AI 对算力需求的快速增长,单靠 CPU 已无法满足现实需求,异构计算(CPU+XPU)成为必然选择。但硬件本身并非决定因素,真正影响算力释放的,是软件与应用生态。他通过对x86、Arm和RISC-V的分析,指出生态惯性和软件兼容性在商业化和技术落地中起到决定性作用,生态成熟度往往比硬件性能更能决定芯片成败。
唐志敏也强调,软件定义一切,这不仅意味着应用开发与性能优化,更决定了算力芯片的长期竞争力和产业格局。
在算力体系演进中,硬件是基础,但软件和生态才是真正的“决定因素”。无论是 CPU、GPU 还是未来的 XPU,掌握和构建完整的软件生态,才能在高速增长的算力需求与复杂的技术挑战中立于不败之地。
精彩演讲回顾
演讲完整视频,详见链接:https://youtu.be/m47Dd5rJisw
以下为唐志敏老师的精彩演讲内容,雷峰网作了不改变原意的整理与编辑:
从“算力”到 Computility:算力正在被重新定义
“算力”其实是中国人自己创造出来的一个词。以前在计算机领域,更多讲的是performance(性能),而不是算力。中国人什么事情都喜欢讲“力”,比如体力、臂力、脑力,现在又有了算力。
既然是我们自己创造的词,那怎么翻译成英文?有人翻成Computing Power,但这个词我觉得不太好,听起来就很费电,现在的算力确实费电,但我们并不希望算力特别“更费电”。
所以有计算所的老师创造了一个新词,叫Computility,把Compute(计算)和Utility(设置)合在一起,我个人是比较认同这个说法的。我们希望算力像水、电一样,成为一种基础设施。
实际上算力就是:在可接受的资源、可接受的时间内,完成某种计算任务的能力。
在算力这个概念之上,最近几年又出现了很多新的“力”。比如现在大家讲得比较多的:
训力,就是快速训练出大模型的能力;
推力,就是基于大模型快速推理、生成结果的能力。
未来还可能会有什么力?我自己也做过一些畅想。现在的大模型已经可以理解语言,也可以生成视频,GPU 可以渲染高度逼真的图形。如果把这些能力结合起来,也许有一天,我们可以把小说直接“演”成电视剧。这种能力,本质上还是算力体系不断演进的结果。
CPU 不能满足需求,异构计算成为必然选择
各种各样的计算芯片,是算力的基础。我原来是做高性能计算机体系结构,后来进入半导体行业,会发现处理器和其它很多芯片并不一样。处理器不是一个单纯的硬件,它最复杂的地方在于,要支撑运行非常复杂、规模巨大的软件系统,所以出现了“软件定义一切”的概念,比如软件定义存储,软件定义网络,软件定义无线电。
虽然摩尔定律逐渐放缓,但算力需求,尤其是生成式人工智能对算力的需求,却在持续快速增长,而且增长速度远远超过了制程和工艺所能带来的性能提升。
在这种情况下,只靠CPU肯定不能满足对算力的需求。CPU的主频和整体架构,二十多年里并没有发生本质变化,所以我们只能通过CPU + XPU的方式,比如CPU+GPGPU,或者其他的PU,总称为XPU,和CPU形成异构计算架构,在通用性、性能、能耗和成本之间寻找平衡。
XPU 的本质:硬件只是资源,性能取决于软件
但异构计算带来了编程、软件兼容性两大难题:
编程变得更加困难;
原来只在CPU上运行的程序,如今要分为两部分,一部分仍在CPU上,另一部分放到XPU上运行。
从计算机体系结构的角度看,我习惯把架构分成三类。
第一类是比较激进的结构,主要靠硬件做动态优化。为了运行复杂应用,硬件要分析指令之间的并行性,典型代表就是传统 CPU。
第二类是比较保守的结构,硬件并不去做复杂分析,而是提供大量运算部件和存储资源,至于这些资源怎么用,主要依赖软件,比如GPU和各种XPU。
第三类是动静态优化相结合的结构。
XPU本质上属于保守型结构。硬件只负责把计算资源提供出来,并不保证性能一定能发挥出来。性能能不能出来,更多取决于软件、编译器和程序员。
自动并行化这个方向,学术界和工业界研究了几十年,效果始终有限。现实中,真正能把性能跑出来的,还是依赖经验丰富的程序员和成熟的软件体系。
也正因为这样,我一直强调,算力芯片真正面临的核心问题,不是硬件架构,而是应用生态。
所谓生态,就是能在处理器上运行的所有软件的总和,包括应用软件、操作系统、编译器、中间件、函数库和开发工具。最终真正产生生产力的,是应用软件,而不是芯片本身。
生态惯性:x86、Arm与RISC-V的现实边界
在CPU领域,x86生态经过四五十年的发展,已经有非常高的市场占有率和生态惯性。哪怕是英特尔自己,也很难去推动一个不兼容x86的体系。
根据Gartner给出的全球企业软件的情况,经过多年发展,x86软件市场越来越大,基于x86软件的销售收入是3000多亿美元。为x86开发软件的费用,每年大概是600亿美元。而全球服务器市场总的收入,大概是800亿美元。也就是说,一年卖出800亿美元的服务器,为了开发x86软件,每年要新增600亿美元。可见软件开发需要耗费大量精力。
在手机领域很成功的Arm也想要进入服务器领域,可以看到一个又一个Arm架构服务器公司屡战屡败。他们的失败有各种各样的原因,我认为Arm架构在服务器领域要成功需要有两个原因:一个原因是掌握全栈技术的大公司不再使用x86,这是Arm的机会,典型的比如苹果不用x86,自己掌握软件栈可以切换。另一个原因是端云融合,手机上和云端都用Arm架构,这样手机上的应用比较容易迁移到云端,包括云游戏等,这样Arm在服务器市场才更容易成功。
除了Arm,RISC-V也是一个大家都在关注的方向,但RISC-V到底灵不灵?它的开放性确实带来了新的可能性,但开放和开源本身,并不自动等于成功,开放的CPU有很多,比如OpenRISC、OpenSPARC、OpenPower现在也开放了。
也有人说Arm太贵,用RISC-V可以省钱。但我之前做芯片公司的时候,一直买Arm的IP授权,也没觉得有多贵。若干年前,Arm一年的收入十几亿美元,如今Arm每年收入三四十亿美元,Arm收入的增加是在很多公司使用RISC-V的背景下,这从某个角度说明了做RISC-V的公司需要反思。
还有人说RISC-V更适合做研究,因为可以随便修改。但我认为做研究用什么架构都可以,不一定要用RISC-V,用x86、Arm照样可以做研究,这不是理由。
RISC-V开放,很多人希望用开源硬件去走一条类似开源软件的发展路径,但我一直觉得,这条路并没有那么容易。和开源软件相比,开源硬件的难度要大得多。
从现实情况看,现在全球的 RISC-V 都面临着商业化的困难。我看到一条新闻,Jim Keller——这个行业里做CPU架构的顶级人物——创办了一家做RISC-V的公司Tenstorrent,最近开始裁员了。包括Tenstorrent在内美国好几家公司做出了RISC-V芯片,但问题是不知道卖给谁。
目前相对做得好一些的,反而是一些软件相对简单的嵌入式场景,比如做存储的企业,把 RISC-V 用来做存储控制器。这类场景软件非常简单,确实能用,也用得不错。但一旦进入计算领域RISC-V面临的问题就多了很多。
这背后反映的,不只是软件生态的问题,硬件生态本身也还不成熟。只要是 CPU,就一定会走向多核,多核就涉及片上互联网络,Arm在片上互联这件事上,已经有比较成熟的解决方案,但RISC-V还没有。
于是就出现一种很现实的困境:想做RISC-V CPU,但片上互联又要去找Arm买。Arm愿意把互联网络卖给你,也想顺便把CPU核一起卖给你。这就是RISC-V目前在工程层面面临的实际困难,也说明还有很长的路要走。
为什么兼容 CUDA 容易,复制 CUDA 生态极难?
也有人认为,将来指令系统可能没那么重要,因为现在是“软件定义一切”,上层可以用 Python、Java 这些平台无关的高级语言。但从实际发展来看,情况并不是这样。以Intel为例,无论是过去的AVX-512、SGX,还是现在围绕人工智能不断加入的新指令,都说明:硬件指令的直接支持,对性能和能效始终是有价值的。
在XPU领域也是类似的情况。现在大家都在讲兼容 CUDA,因为 CUDA 的生态确实做得好。很多做其他XPU、AI加速器的厂商,第一件事就是要兼容CUDA。
但 CUDA本质上是什么?它其实就是一个高级语言接口,是英伟达的一套API。从技术角度看,兼容一个API并不难,有一个编译器,就可以兼容CUDA的接口。但真正难的,是兼容 CUDA 背后的软件生态。
生态从来不只是一个 API,它包含了大量算力库、函数库、开发工具和工程实践,这是一套非常复杂、长期演进的体系,工作量极其庞大。
也正因为如此,现在国家层面也意识到这个问题的重要性,正在推动大家一起做生态建设。从这个角度看,打造我们自己的算力生态是非常有必要的。除了CUDA,英特尔、AMD 也都在做各自的生态,我们如果不做,就永远受制于人。
谁能把芯片做成?软件生态决定成败
从整体来看,我们现在的算力体系仍然存在不小的缺口和瓶颈。中国乃至全球范围内,半导体的发展速度都在放慢,但算力需求却在持续增加。中国还面临制程方面的限制,这就决定了我们必须通过跨学科交叉,在系统、软件和算法层面,去寻找实际性能的突破。
算力的发挥,靠的不只是硬件。硬件当然是基础,但硬件的峰值性能,本质上只是一个指标。真正的性能提升,很大一部分来自软件优化。
做高性能计算的人都知道,LINPACK可以把整机效率跑到60%~70%,但LINPACK只是测试程序,不是真实应用。真正的应用软件,能跑到整机20%~30%的效率已经非常不容易。这里面还有很大的优化空间。
我们的芯片峰值性能可能很难做到最高,但如果能打破硬件和软件之间的隔阂,在软件、编译、系统层面多做一些优化,即便在峰值性能相对低一些的芯片上,也完全有可能获得不错的应用效果。这是未来非常重要的一项工作。
另外,现在大家都在做 GPGPU,但GPU最基本的能力同样重要,比如纹理生成、图案着色、光照和阴影处理等。现在有些GPGPU已经发生了“异化”,只能计算,不能渲染。但如果我们真的要实现从小说生成电视剧,不仅需要 GPGPU 的计算能力,也同样需要GPU的图形渲染能力。AIGC不只是生成文章,还应该能生成影视内容。
计算芯片产业的发展,本身是一个螺旋式上升的过程。早期系统厂商都会自己做CPU,因为 CPU是计算机系统的核心;后来由于量产和成本压力,x86快速发展,系统厂商逐步退出;而现在,系统厂商和平台厂商又重新开始自研芯片。
美国的互联网巨头如此,中国的互联网厂商、系统厂商也都在自研CPU。自研自用这条路能不能走通,关键并不在于“能不能做芯片”,而在于:能否为产品和服务提供足够大的增值,能否掌控全栈软件体系。
苹果是一个非常典型的成功案例。从跟摩托罗拉和IBM联合开发PowerPC CPU,到转向采用Intel CPU,再到基于Arm架构自研CPU,它之所以能成功,原因其实非常简单:通过自研高性能芯片,配合自有的软件体系,形成非常领先的用户体验,在此基础上把产品卖得很贵。手机卖得贵,笔记本也卖得贵。其它厂商如果做不到这一点,仅仅自研芯片,最终大概率都会失败。只有软硬件通吃,才能真正卖得贵。
我们要不要再搞新的指令系统?我个人的看法是:架构创新不需要依赖新的指令系统。指令系统只是硬件和软件之间交流的语言,我们没必要不断增加新的语言。如果要做创新,在现有指令体系下完全可以做,RISC-V 已经足够了。
归根结底,谁能把芯片做成功?不管是CPU还是GPU,只有真正重视软件和应用生态,才有成功的可能。“软件定义一切”,这个“一切”,同样包括成功和失败。
对于平台厂商和系统厂商来说,如果要自研芯片,一定要有清晰的差异化,并且这个差异化必须能为系统或服务带来显著增值,否则使用成熟的商用芯片,反而是更理性的选择。
最后我还是希望,大家能把RISC-V作为一个统一的指令系统方向。无论是CPU、GPU还是其他处理器,都尽量统一到同一架构平台上,减少重复投入。
我们常说“三国定律”,合久必分,分久必合。过去是CPU为中心,现在是CPU + XPU的异构体系,未来也许会回到以CPU为中心的新一体化架构。RISC-V具备一定的包容性,有机会融合 CPU、GPU 和 AI 处理器的特性,吸收开源体系的力量,逐步突破 CUDA 的生态壁垒。
以上就是我全部的分享,谢谢大家。
相关版本
多平台下载
查看所有0条评论>网友评论