Gairdao Community

Loading...

137 个结果

Rich Sutton 最新 WAIC 演讲：从数据时代到经验时代的 AI

整理丨梁丙鉴编辑丨陈彩娴 AI 和人都站在两个时代之间的历史转折点上。随着人类数据中可提取的知识迅速接近极限，Scaling Law 的终点已经隐约可见。今天的大语言模型可以编程、写诗，却仍无法独立发现新知。显而易见，真正的智能，呼唤着新的训练范式出现。更迫切的问题关乎人自身。自古以来，智者们便试图理解人的心智如何运作。当这一原理终于要被探明，千年追求的终点前却不仅有期待，还有对 AI 的恐惧。站在 AI 智能水平可能超越人类的转折点上，我们要如何看待它？以及更关键的问题，如何看待自己？ WAIC 2025 现场，现代强化学习的奠基人、阿尔伯塔大学教授 Rich Sutton 教授发表了题为《从数据时代到经验时代的 AI》的主旨演讲。Sutton 教授指出，学习源于强大的体验，而体验是心智活动的基础。智能体与世界的第一人称互动中，可能藏着一条通向超越人类智能的小径。 “经验时代”的概念由此而来。智能体对世界进行感知与交互，获取海量动态且高度定制化的数据，这种数据源将超越任何静态的合成数据生成程序，也更贴近生命的本质。就像 Sutton...

on 2025-09-04

WAIC最强亮点：非Transformer离线AI大模型已大规模量产，大模型商业比我们想得更快II

作者丨郭海惟编辑丨陈彩娴会自我学习自我生长的大模型。智能离线内容可见上篇 2. 场景、场景，还是场景 “踩技术的坑”，只是RockAI过去一年两大“年度工作总结”中的一个。而比技术的坑更大的，则是“场景的坑”。场景很难，邹佳思对AI科技评论说，演示和落地之间存在鸿沟，量产化落地难上加难。假如说，Yan1.2部署在树莓派可以算得上一个写在公司手册里的里程碑事件。那么Yan1.3发布后，公司拿到了出海头部硬件公司的订单，则又算得上是业务里程的一大步。邹佳思至今都记得，当合作伙伴把搭载着Yan1.3能力的PC拿给海外经销商的时候，合作伙伴的震动与兴奋。甚至一些实力雄厚的“巨头”友商代表，都专门到展台前面询问离线端侧功能是怎么实现的。断网其实是一件比很多人想象得更重要的事情。 “离线端侧大模型在海外的需求是非常旺盛的”，邹佳思对AI科技评论表示，只是其中很多需求还没有获得最佳的解决方案。首先，对于出海的硬件企业来说，海外关于信息安全的政策环境是很多样的。端侧可以规避大量信息传输、上云带来的政策风险与合规成本。...

on 2025-09-04

2025 上半年具身智能融资复盘：金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多

作者丨丁莉编辑丨陈彩娴聚身智能成为新机遇？资本兴趣又面向何方？时间进入7月，半个月来，国内具身智能领域共发生16起融资事件，几乎平均每天一起。仅7月8日一天内，就有6家公司官宣获得了新一轮投资。将时间线进一步拉长，今年以来截至7月16日，AI科技评论以“具身智能”为标签在IT桔子上检索到融资事件共计130件。其中，已明确公布的融资金额共计96.68亿元；另有98件未公布明确金额的融资事件，从千万级到数亿元不等，如果再算上这一部分，预估整个具身智能领域上半年的总融资超过了 200亿人民币，甚至更多。相关数字已远远超过 2024 年全年的 90 起融资 — — 89.33亿元融资金额。去年涌向大模型的科技投资，今年开始掉转方向拥抱具身智能，但钱具体流向了哪里？ AI科技评论梳理出的上半年融资金额与轮次最多、估值增长最突出的13家具身智能赛道头部公司，大多都选择了大脑与本体“两条腿走路”；在它们的资方构成中，大厂和传统制造巨头充当了重要角色。资本日渐向头部企业聚拢，或将倒逼创新收敛，并把行业提前带到洗牌期。 Press enter or click to...

on 2025-09-04

最新 AGI 暴论：强化学习RL的「GPT-3 时刻」实现，还需要 1 万年？

「复制训练」或许是一条推动 RL 模型走向通用智能的重要路径。编译丨郑佳美编辑丨陈彩娴最近，国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文，提出一个大胆的判断：RL 或许要迎来属于它的 “GPT-3 时刻”，但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。在他们看来，当前的 RL 模型还存在明显短板，比如泛化能力差、难以适应新任务等，这种局面其实很像 GPT-3 出现之前的语言模型 — — 能解决特定问题，但难以迁移和扩展。为了解决这个问题，他们提出了一种新的训练范式，叫作“复制训练”（Replication Training）：让模型在虚拟环境中模拟真实软件的操作过程，比如使用浏览器、编写代码、处理命令行任务等等。这种训练方式的好处在于任务目标清晰、评分机制明确，同时还能大规模自动生成训练数据，非常适合用在 RL 模型的系统性训练中。当然，它也不是万能的，比如在任务开放性和测试设计方面还有一些挑战。但他们认为，复制训练是一条能推动 RL 模型走向通用智能的重要路径，有望带来一次类似 GPT-3 那样的能力跃迁。综上，AI...

on 2025-09-04

大语言模型的新征程—— ACL 2025 顶会见闻前沿论坛实录｜GAIR Live

ACL 投稿破 8000，大模型把计算语言学推向‘智能体’时代，三位顶级学者拆解 NLP 未来趋势。作者丨岑峰编辑丨陈彩娴 2025 年的 ACL（计算语言学协会）年会，无疑是大语言模型（ LLM ）持续主导 NLP 领域的又一里程碑。这不仅仅体现在学术研究的深度，更体现在会议本身的各项数据上 — — 史无前例的 8000 多篇投稿，其中中国作者的比例高达 51%。这一现象清晰地传递出大模型已成为 NLP 领域核心的信号，也标志着整个行业的格局正在发生深刻变化。通过与多位参会者的沟通，我们得出这样的结论：大模型并未 “冲淡” 计算语言学的核心，反而在其技术框架下，为传统议题赋予了新的定义和呈现形式。同时，其多模态特性打破了传统的研究壁垒，吸引了来自计算机视觉、网络安全等不同领域的学者，使得 ACL 大会的氛围愈发跨学科。为了深入剖析这一变革，雷峰网、AI 科技评论 GAIR Live 品牌特别邀请了三位杰出学者 — — 美国埃默里大学副教授刘菲、美国约翰霍普金斯大学助理教授肖超玮，以及中国科学院自动化研究所研究员张家俊，三位嘉宾从他们在 ACL...

on 2025-10-10

当智算变局到来，我们该如何 “用对” 算力？| GAIR Live016

当智算变局到来，我们该如何 “用对” 算力？| GAIR Live016 卡脖子的不是模型，是“用不对”的算力。作者丨岑峰编辑丨陈彩娴 2025 年的 AI 圈，终于从 “大模型崇拜” 走进了 “应用现实主义”。当百度文心、阿里通义、腾讯混元等基础模型的参数竞赛告一段落，当 “百模大战” 变成 “百业应用”，企业们突然发现：曾经被当作 “基建” 的算力，成了应用落地的 “胜负手” — — 不是没有算力，而是找不到 “刚好能用” 的算力；不是算力不够，而是 “用不对地方” 的算力在浪费；不是买不起算力，而是 “不会用算力” 的成本在吞噬利润。而 Oracle 与 OpenAI 签下 3000 亿美元的算力大单同样是行业变化的风向标：这不是简单的 “卖算力”，而是 “生态绑定”：OpenAI 需要 Oracle 的超大规模算力集群支撑 GPT-5 的训练与推理，Oracle 则通过绑定头部模型公司锁定未来十年的算力需求。这反映了全球算力市场的两个核心趋势：其一是 “算力需求从集中走向爆发” 。大模型训练需要巨量算力（GPT-5 的训练算力是 GPT-3 的 10...

on 2025-10-10

AI PC，一场关于算力、场景与生态的远征

英特尔正通过其 XPU 混合架构、AI 算力以及开放的软件生态来引领这一趋势。作者丨马晓宁编辑丨陈彩娴 AI PC 市场的竞争正在升温，格局也在重塑。无论是对于终端 AI 的讨论，还是智能硬件的热潮，其本质都是关于下一代计算入口的争夺，其底层逻辑是，将智能无缝融入个人设备，让 AI 从需要主动调用的工具，演变为随时待命、主动服务的环境能力。交互模式的改变，意味着我们需要重新定义终端的形态，而 PC 作为个人办公和娱乐的第一设备，就成为了必争之地。这一趋势在9月25日2025抖音商城秋上新·琥珀流光上新大秀中，也可见一斑。传统时装周的物理边界被彻底打破，取而代之的是无限延伸的数字景观；游牧诗人和极简高智等主题之下，模特穿梭于算法丛林，整体视觉既保留了秋日的温暖醇厚，又充满了数字时代特有的流动性与神秘感。在线下展区，多项全新酷炫的技术产品一一展出，英特尔酷睿 Ultra 系列处理器，以及华硕、荣耀和联想三款搭载了酷睿 Ultra 处理器的新款 PC ，占据了全场焦点。 01. 芯片创新是核心生产力英特尔正将 AI PC...

on 2025-10-15

对话 MoonBit 张宏波：为 AI 重构编程语言

AI Coding 最激进的拥趸，已经对编程语言下手了。作者丨梁丙鉴编辑丨马晓宁 “重构”是伴随大模型的热词之一。无数人喊出这个口号，朝着软件、公司乃至一个行业的既有模式摩拳擦掌。然而即使是这样的壮志也仍然没有触及变革的最底层，在应用层之前，张宏波认为，大模型首先应该要重塑的是编程语言本身。来自美国的连续创业者 Nathan Baschez 近日在 X 上预言：「OpenAl 或 Anthropic 将在 TypeScript 上发布一种编程语言或框架」，原因是：类型安全对 AI 编写和验证代码非常有帮助现在人类不再愿意编写重复样板代码的限制已被打破只有大型实验室才有预算从头构建训练数据脚手架或许这则预言并非绝对准确。“相比 OpenAI 和 Anthropics，MSFT 和 Google 更有可能成为预言的主角。”张宏波告诉我们，“但市场对一门全新的 AI 原生编程语言的需求已经成为共识。”...

on 2025-10-16

从李飞飞直播到老黄女儿首秀：英伟达在下一盘什么大棋？

英伟达的下一幕：不谈 GPU，而谈「造世界」。作者丨郑佳美编辑丨马晓宁最近，英伟达又成了话题中心。短短几天里，接连两场看起来毫不相干的活动持续刷屏，一场是斯坦福教授李飞飞和英伟达首席科学家 Jim Fan 的直播，对谈主题是“让 AI 学会在世界里行动”，而另一场黄仁勋的女儿、英伟达产品营销高级总监 Madison Huang 首次公开亮相，与光轮智能（Lightwheel）创始人谢晨展开对话，共同探讨仿真、具身智能与 Sim2Real 的未来。两场活动一边属于学术界的象征，一边则是产业界的未来接班力量。但当我们把它们放在一起看时，会发现它们其实讲述的是同一件事：英伟达正在全力推进它的仿真计算机战略。这是黄仁勋为未来十年定下的方向：用 Omniverse、Isaac Sim 和 Physical AI 三大支柱，去构建一张贯穿虚拟与现实的“智能物理世界计算网”。简单来说，英伟达想要打造的不只是更强的算力，而是一套让 AI 能够“在世界中学习与行动”的系统，让机器不止能理解数据，而是真正学会理解世界本身。英伟达正在下很大一盘棋。 01 三台「计算机」的新格局 ...

on 2025-10-21

具身智能的“生命线”：数据基石与未来路径 | GAIR Live 017

仿真合成数据是通往具身智能的必经之路。作者丨岑峰编辑丨马晓宁如果说大模型的出现引爆了通用人工智能的想象，那么，具身智能则让 AI 拥有了可以感知、决策和行动的“身体”。而这一切的背后，都离不开一个至关重要的“生命线” — — 数据。近日，雷峰网主办了一场主题为《具身智能数据：赋能感知、决策与控制的智能之源》的线上圆桌论坛，邀请了香港大学助理教授李弘扬、光轮智能联合创始人兼总裁杨海波、艾欧智能联合创始人、技术总监高飙三位重量级嘉宾，共同深入探讨了具身智能从数据采集、合成到闭环学习的全过程，为行业揭示了构建具身智能“生命线”的核心挑战与解决路径。具身智能数据面临的挑战比传统 AI 领域更为严峻。嘉宾们一致认为，数据是构建“机器人基础模型”（Robotic Foundation Model）最关键的一环，但目前行业面临三大核心挑战：数据稀缺性与泛化能力、物理真实性与规模化短缺、商业与数据飞轮的脱钩。针对真机数据的稀缺性和高门槛，嘉宾们分享了各自的独特解决方案：李弘扬教授团队发布的 AgiBot World...

on 2025-10-29

User Profile