编辑部 整理自 凹非寺量子位 | 公众号 QbitAI
“人工智能要发展到下一个台阶,一定要突破两座大山。第一座大山是Transformer,第二座大山是反向传播算法。”
在大模型规模不断拔高、算力与数据卷到极致的当下,RockAI创始人刘凡平提出了一个与主流共识截然不同的判断。
下一阶段的智能,不在“更大”,而在“活起来”。本质是让模型摆脱静态函数的桎梏,让端侧设备具备原生记忆、自主学习与持续进化的能力。
这意味着AI的方向要从云端集中式的算力竞争,迁移到每一台设备,每一个个体都能参与学习,生成知识的全新范式。
在量子位MEET2026智能未来大会上,刘凡平将这一转折点称为硬件觉醒
当模型在端侧能像大脑一样稀疏激活、实时形成记忆,并在物理世界中不断更新自身,设备就不再是工具,而是“活”的智能体。
而无数这样的智能体在现实世界中学习、协作,便将孕育出真正能够产生知识的群体智能。
这既是对Transformer与反向传播算法这“两座大山”的正面突破,也是迈向通用人工智能的一条新路径。
为了准确呈现刘凡平的完整思考,以下内容基于演讲实录进行整理编辑,希望能提供新的视角与洞察。
MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。
核心观点梳理为Token付费是一件很愚蠢的事情,用户应该为智能付费。端侧模型不是云端大模型的小参数版本,端侧模型关键在于自主学习和原生记忆,Transformer架构模型无法在端侧实现这一点。人工智能要发展到下一个台阶,一定要突破两座大山。第一座大山是Transformer,第二座大山是反向传播算法。原生记忆和自主学习带来的变化除了Token不再收费,更多的还有重新定义硬件的价值。每台设备拥有自己的智能并能向物理世界学习,就会产生群体智能,如同人类社会个体相互合作产生知识。现有大模型(尤其是Transformer架构大模型)本身不产生知识,只是传播知识;群体智能才是迈向通用人工智能的最佳途径。
以下为刘凡平演讲全文:
硬件可能觉醒吗?
很高兴能够和大家在今天分享RockAI在模型层面的思考,也许今天讲的内容和大家平常理解的有些不一样——我们认为通用人工智能一定有自己的发展路径。
今天分享的主题是硬件觉醒。
我们知道硬件是没有生命的,怎么可能觉醒?没错,我们做大模型应该重新思考这一切的东西,这一切就是因为被Transformer束缚了
我想问一下大家,你期待的未来的智能硬件是什么样子?是你的智能手机还是平板,还是前两天的豆包手机?
今天很多大会嘉宾都提到了Agent,提Agent的时候都提到一个点:工具,更高效的工具。
当前很多人还是把大模型当工具用。就像计算器一样,我需要的时候拿过来用一下,不需要的时候就放开了。
从智能发展角度来想想:豆包手机能按照指令打开APP做相应的事情,下一步会发生什么?它能打开微信发信息,那微信未来的样态还是现在这样吗?它能打开高德地图,高德地图十年以后还是现在这样吗?
大家会发现,目前是一个中间状态,并不是终极状态。
为Token付费是一件很愚蠢的事情
刚刚很多嘉宾提到,Token消耗量增长了10倍,尤其是使用上Agent之后。
这本质是在为Token付费。
但大家有没有想过:为Token付费是一件很愚蠢的事情
我们为什么做大模型?是因为智能。如果要付费,应该是为智能付费,为什么为Token付费?
打个比方,有的人讲话只要简单几句就能说清楚,有的人说话很啰嗦,我难道要为它的啰嗦付费吗?肯定是不对的。
细想一下,就会发现为Token付费是一个错误。未来(两年之后)回头看,我相信大家一定也会疑惑当年居然还为Token付过费、充值过。
端侧模型并不是云端大模型的小参数版本
硬件已经发生了很多变化,当前的云端大模型已经慢慢走向了终端设备。
为什么这么说?我们不否定云端大模型的好处,尤其在工具使用上,云端大模型非常优秀。
但是未来AI是属于每一个人的。要让AI走向每一个人的世界,最重要的是端侧的智能
一方面因为端侧离你更近,而且端侧还有一个“数据无处不在”的好处。
我一直以来比较反感把所有数据采集到云端,云端训练好了再下发给用户使用。
数据明明就在你的身边,为什么做不到就让它在你身边?因为云端大模型参数量太大了,也没有这么多设备收集你身边的数据。
端侧大模型如果能在设备上收集数据,而且是完全属于你个人的数据,且这台设备又能和你其他设备关联,那个时候大家就不会单纯把模型当做一个工具来使用了。
很多人觉得端侧受限于设备,算力有限,所以在云端做几十B的“大”模型,端侧做几B的“小”模型,就成了端侧模型。
端侧模型并不是云端大模型的小参数版本
RockAI对端侧大模型有两个非常关键的定义:自主学习和原生记忆。这是我们认为最重要的事情。
如果是Transformer架构的模型,无法在端侧实现自主学习与原生记忆。
跳出Transformer架构去看问题
Transformer很优秀。
我自己就是国内最早研究Transformer的人之一,对它早期的成功非常认可。
但它现在进入到一个死亡螺旋的状态,带来一个问题——为了让模型能力足够突出我们要加大算力、加大数据,带来成本极大提升。大家和竞争对手都在做同样的事情。
你会发现,大家都没有管架构,大家都在干数据和算力。因为“只要我数据算力够了,我就做得更好”。
我们认为,信仰Scaling Law的成功在现在看来是错误的。不仅我这样说,现在很多人也有类似的观点。
核心本质不在于模型不够大,而在于思考的方式错了。
模型本身是一个静态函数,这种静态函数是不太可能会具备真正的智能。因为人的大脑是一个动态函数,每时每刻都在建立新的连接,而新的连接是动态结构的。人的大脑是因为这样才有了记忆的能力。
另一个误区是“更多参数就意味着更多智能”。
在Transformer架构下这样想没错,但如果跳出Transformer架构就不是这样了。
举一个简单的例子——
生物界,一条蛇或者一个小兔子它没有智能吗?应该没有人否定它们的智能。
和人脑相比,它们大脑拥有的“参数”肯定少很多。
另外还有长上下文。
2024年,长上下文方面有很多突破。但我们一直不认为长上下文是一种记忆,真正的记忆应该像人大脑的海马体一样,会把所有信息通过加工处理压缩存储下来,根据需要的情况会移除掉一部分信息。
这种记忆是参数化的记忆,不是靠上下文完成的。靠上下文完成,记忆就会很短。
为什么现在大家又执着于做上下文?是因为Agent,而Agent背后的Transformer架构模型部署后是一个静态函数,没办法,只能通过上下文改变它的能力。
讲到这里大家就会恍然大悟,长上下文其实是一个退而求其次的方案,并不是真正智能的解决方案
上下文窗口超过100万Tokens也好,200万Tokens也好,1000万Tokens也好……但每时每刻产生的Token远远超过了这个量。就拿今天大会大家分享的内容来说,就已经远远超过了1万Tokens。
记忆能让人形成长期认知,是一个过程。我们的价值观就是记忆逐步积累起来的。如果记忆只靠长上下文,那么就形成不了价值观,更不会有知识沉淀。
人的聪明来自长时间的积累。
训推同步,带来自主进化
回到刚才说的,未来的智能硬件最重要的应该是原生记忆和自主学习。
刚才说了原生记忆,现在来说自主学习,自主学习是一定要走向物理世界的
自主学习带来的一大好处就是模型不会因为部署就“死亡”了。
可能大家不知道,因为参数已经固定,所以模型在部署的那一刻就死掉了。想要改变,就只能上传到云端服务器重新训练,过一段时间再下发给大家使用。
一旦能够自主学习,随之而来的自主进化就会带来全新的改变。我们就不再认为它是一个固定的工具,而是可以持续学习的。
我们把这种持续学习状态的技术称之为训练和推理同步进行
训练和推理同步进行,就像我站在这里输出一些内容(可以看成大模型的推理过程)的时候,也在获得一些新的东西。我的推理和训练是同时完成的。大脑不仅在推理,参数也在不断改变,这就是“活”的东西。
今天发布了一个模型,过三个月再去问这三个月里发生的事情,它是不知道的,需要通过知识外挂RAG等方式弥补。这不是临时方案是什么?
我们作为研究者,应该要面临这样的现实——
大模型的很多方案都是临时方案,并不是真正的终局方案,终局方案就是要改架构
我自己的观点是这样的:人工智能要往下发展到更高的台阶,一定要突破两个大山,第一座大山是Transformer,第二座大山是反向传播算法(反向传播算法制约了现在很多设备的发展,包括算力的发展)。
模型架构一定要改
为了让模型不再死亡、能够进化,模型架构一定要改变。
以我们自己研发的Yan架构的大模型为例,整个模型极端稀疏化,激活机制比MoE更稀疏。
它模仿了人类大脑的运行机制。人的大脑大概有860亿参数,但二十几瓦的大脑预算峰值就可以推动大脑运算。
另外,我们在模型中加入了记忆模块。也就是说,推理过程中,随着你跟它沟通,记忆模块会发生改变。所以真正的记忆开始了,真正个性化开始了。
如果一个设备拥有了自主学习,就有了新的可能性。
今年世界人工智能大会我们发布的一个部署了模型的小设备,是一个机器狗,最开始什么能力都没有,但是可以现学现会。我们模型不一定需要云端GPU,手机、CPU上都能直接跑
这还仅仅是一个简单的机器狗。如果范围更大一点,到具身智能呢?
具身智能现在没办法进入千家万户,核心原因是没法在出厂的时候适应每个家庭,服务好每个家庭。它需要学习。
一个人到了酒店,还得看一下酒店的布局,知道书房在哪里,洗漱间在哪里。
未来设备也是一样,它需要专门了解,有一个学习的过程,而不是出厂的时候就会用所用家电了。这个学习的过程是Transformer架构现在很难具备的。
智能会重新定义硬件的价值
原生记忆和自主学习带来的变化不仅仅是Token不再收费了,更多的还有智能重新定义硬件的价值。
举个例子。比如说花两万块钱买了一只宠物狗,它陪伴了你两年,你跟它产生了情感依赖。两年之后你还会花两万块钱把它卖掉吗?我想那个时候你肯定不是思考两万块钱的事情,而是更在意狗和你之间产生了多深的情感。
未来的硬件其实需要让用户与它共同创造价值,而不是为它的功能买单。
就像买一部手机,未来为它付费的不是内存,是与它的价值共创。你买它的时候它的价值是最小的时候
所以我们认为智能会重新定义硬件的价值,它就不再只是一个工具了。
我们的模型能够在手机、具身智能等设备上灵活运行。比如在手机上部署的3B的离线模型,保证了用户的隐私和安全,体验还非常流畅。
特别强调的是,在离线情况下,多模态感知能具备记忆和自主学习能力,那么硬件价值一定会发生很大变化。这也是全新架构带来的全新可能。
Transformer几乎不可能做到这个水平。因为手机上运行它会消耗很高的内存资源。
每台设备拥有自己的能力并能向物理世界学习,就会产生群体智能
当硬件拥有了原生记忆和自主学习,还会发生什么样的变化?
不同于OpenAI,也不同于DeepSeek,我们认为这条路径是群体智能。
每一台设备都拥有了自己的智能,此外还能向物理世界进行学习的时候,就会产生群体智能
群体智能有点像人类社会。每个人都不是全能的,我们不需要造一个全能的人,更不需要人人都全能。大家只需要有自己擅长的点就可以了。
更多智能来自于相互之间的合作,合作过程中会产生真正的知识。
知识有两部分:一个叫产生,一个叫传播。
现在大模型——尤其是Transformer架构大模型——有很大的一个问题,它本身没有产生知识。
真正的智能应该是产生知识。人与人之间随时在产生知识,正是因为每个人的不同产生了不同的解决方案。
真正的智能涌现来自于每个个体,每个个体产生信息之后,再传播给更多的人。我们是在这样的过程中形成了人类逐步发展的文明,而不是靠一个足够聪明的云端通用大模型来造神。
云端通用大模型的厉害之处无非在于收集的数据,而收集的数据无非来自于人类社会的经验。如果它连自己原生的记忆和自主学习都不具备,是不可能产生真正的智能。
RockAI一直认为群体智能才是迈向通用人工智能最佳的方式,而不是OpenAI造神的路径。
我的分享就到这里,谢谢!
《葡京导航官网网站》,《首次登录送91元红包》dafa888
“leyu乐鱼线路检测”
单机版炸金花下载官网
……
{!! riqi() !!}
“澳门威尼斯人网上娱乐”{!! reci() !!}
↓↓↓
{!! riqi() !!},欧盟延长对俄罗斯经济制裁6个月,新宝注册登录平台,365外围app,伟德体育可靠吗,云顶娱乐官方
{!! riqi() !!},以总统:将从“国家利益”考量内塔尼亚胡赦免请求,大赢家足球90比分,TV188体育,亚娱足球,下注世界杯
{!! riqi() !!},杭州出台物业专项维修资金管理办法 创新设立代行制度,经典全民诈金花现金,云鼎真人注册,沙巴在哪注册,米乐入口
{!! riqi() !!}|澳大利亚邦迪海滩枪击事件死亡人数升至12人|火狐登录官网|j9九游会登录|AOAapp平台|365bet在线客户端
{!! riqi() !!}|特写:钉鞋声里的“工匠精神”|澳门永久网站|球探网足球比分老板本|水果拉霸电玩游戏|ag平台开奖结果不一样
{!! riqi() !!}|清华大学明确:严禁学生使用人工智能代写|365bet体育下载APP|球探网足球手机|m6平台|马经2011A(新图推荐)……
{!! riqi() !!},你有没有吞过“愤怒诱饵”?2025年牛津年度词汇出炉,娱网棋牌官网手机版,皇马国际游戏,现金赌场手游,百老汇网址登录
{!! riqi() !!},让爱滚动:一位特奥滚球教练父亲的长情陪伴,九游会开户网址,88平台集团官网,明发国际网址,摇钱树捕鱼技术打法
{!! riqi() !!}|粤桂协作 助力广西农产品对接大湾区市场|AG娱乐亚美平台|二八杠百人|银河游戏代理|免费送分捕鱼1比1金币
{!! riqi() !!},驻港国家安全公署:坚定支持香港特区依法严惩反中乱港分子“以灾乱港”行径,皇冠即时比分,英国篮球比分,永利网站的网址是多少,幸运快三在线平台
{!! riqi() !!},金正恩就俄罗斯驻朝大使逝世向普京致唁电,美高梅网上游戏,银河澳门app官方下载,葡京体育网址下载app,真人版牛牛可以换现金
{!! riqi() !!},涉新粒子探测、人造细胞等领域 首批3个重大非共识基金项目拟获资助,天富娱乐账号注册,必威网站,华体汇app苹果,longhair网站
{!! riqi() !!}|“‘十五五’时期经济社会发展与统一战线” 学术研讨会在南宁举办|皇冠直营现金网官方网|f66永乐国际AG旗舰厅|bbin足球网投|体育平台被黑
{!! riqi() !!}|聚焦严羽诗学思想 《沧浪诗评》新书发布|ag现金担保网|新皇冠体育网|永乐体育|威尼斯游戏网址大全nv8588
{!! riqi() !!}|苦练内功,做更好的自己|炸金花九张牌|世界杯足彩购买时间|365APP官网|澳门金沙电子游戏在线官网
{!! reci() !!},{!! reci() !!}|截至10月底公募基金管理规模达36.96万亿元|正规网投平台百老汇|天游线路检测中心|优发welcome首页登录|188宝金博赌场网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺