64 个结果
Rich Sutton 最新 WAIC 演讲:从数据时代到经验时代的 AI
整理丨梁丙鉴 编辑丨陈彩娴 AI 和人都站在两个时代之间的历史转折点上。 随着人类数据中可提取的知识迅速接近极限,Scaling Law 的终点已经隐约可见。今天的大语言模型可以编程、写诗,却仍无法独立发现新知。显而易见,真正的智能,呼唤着新的训练范式出现。 更迫切的问题关乎人自身。自古以来,智者们便试图理解人的心智如何运作。当这一原理终于要被探明,千年追求的终点前却不仅有期待,还有对 AI 的恐惧。站在 AI 智能水平可能超越人类的转折点上,我们要如何看待它?以及更关键的问题,如何看待自己? WAIC 2025 现场,现代强化学习的奠基人、阿尔伯塔大学教授 Rich Sutton 教授发表了题为《从数据时代到经验时代的 AI》的主旨演讲。Sutton 教授指出,学习源于强大的体验,而体验是心智活动的基础。智能体与世界的第一人称互动中,可能藏着一条通向超越人类智能的小径。 “经验时代”的概念由此而来。智能体对世界进行感知与交互,获取海量动态且高度定制化的数据,这种数据源将超越任何静态的合成数据生成程序,也更贴近生命的本质。就像 Sutton...

on 2025-09-04
WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快II
作者丨郭海惟 编辑丨陈彩娴 会自我学习自我生长的大模型。 智能离线内容可见上篇 2. 场景、场景,还是场景 “踩技术的坑”,只是RockAI过去一年两大“年度工作总结”中的一个。而比技术的坑更大的,则是“场景的坑”。 场景很难,邹佳思对AI科技评论说,演示和落地之间存在鸿沟,量产化落地难上加难。 假如说,Yan1.2部署在树莓派可以算得上一个写在公司手册里的里程碑事件。那么Yan1.3发布后,公司拿到了出海头部硬件公司的订单,则又算得上是业务里程的一大步。 邹佳思至今都记得,当合作伙伴把搭载着Yan1.3能力的PC拿给海外经销商的时候,合作伙伴的震动与兴奋。甚至一些实力雄厚的“巨头”友商代表,都专门到展台前面询问离线端侧功能是怎么实现的。 断网其实是一件比很多人想象得更重要的事情。 “离线端侧大模型在海外的需求是非常旺盛的”,邹佳思对AI科技评论表示,只是其中很多需求还没有获得最佳的解决方案。 首先,对于出海的硬件企业来说,海外关于信息安全的政策环境是很多样的。端侧可以规避大量信息传输、上云带来的政策风险与合规成本。...

on 2025-09-04
2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多
作者丨丁莉 编辑丨陈彩娴 聚身智能成为新机遇?资本兴趣又面向何方? 时间进入7月,半个月来,国内具身智能领域共发生16起融资事件,几乎平均每天一起。仅7月8日一天内,就有6家公司官宣获得了新一轮投资。 将时间线进一步拉长,今年以来截至7月16日,AI科技评论以“具身智能”为标签在IT桔子上检索到融资事件共计130件。其中,已明确公布的融资金额共计96.68亿元;另有98件未公布明确金额的融资事件,从千万级到数亿元不等,如果再算上这一部分,预估整个具身智能领域上半年的总融资超过了 200亿人民币,甚至更多。 相关数字已远远超过 2024 年全年的 90 起融资 — — 89.33亿元融资金额。 去年涌向大模型的科技投资,今年开始掉转方向拥抱具身智能,但钱具体流向了哪里? AI科技评论梳理出的上半年融资金额与轮次最多、估值增长最突出的13家具身智能赛道头部公司,大多都选择了大脑与本体“两条腿走路”;在它们的资方构成中,大厂和传统制造巨头充当了重要角色。 资本日渐向头部企业聚拢,或将倒逼创新收敛,并把行业提前带到洗牌期。 Press enter or click to...

on 2025-09-04
最新 AGI 暴论:强化学习RL的「GPT-3 时刻」实现,还需要 1 万年?
「复制训练」或许是一条推动 RL 模型走向通用智能的重要路径。编译丨郑佳美编辑丨陈彩娴最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型 — — 能解决特定问题,但难以迁移和扩展。为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。这种训练方式的好处在于任务目标清晰、评分机制明确,同时还能大规模自动生成训练数据,非常适合用在 RL 模型的系统性训练中。当然,它也不是万能的,比如在任务开放性和测试设计方面还有一些挑战。但他们认为,复制训练是一条能推动 RL 模型走向通用智能的重要路径,有望带来一次类似 GPT-3 那样的能力跃迁。综上,AI...

on 2025-09-04