GAIR Live
热门文章
RL
Rich Sutton 最新 WAIC 演讲:从数据时代到经验时代的 AI
整理丨梁丙鉴 编辑丨陈彩娴 AI 和人都站在两个时代之间的历史转折点上。 随着人类数据中可提取的知识迅速接近极限,Scaling Law 的终点已经隐约可见。今天的大语言模型可以编程、写诗,却仍无法独立发现新知。显而易见,真正的智能,呼唤着新的训练范式出现。 更迫切的问题关乎人自身。自古以来,智者们便试图理解人的心智如何运作。当这一原理终于要被探明,千年追求的终点前却不仅有期待,还有对 AI 的恐惧。站在 AI 智能水平可能超越人类的转折点上,我们要如何看待它?以及更关键的问题,如何看待自己? WAIC 2025 现场,现代强化学习的奠基人、阿尔伯塔大学教授 Rich Sutton 教授发表了题为《从数据时代到经验时代的 AI》的主旨演讲。Sutton 教授指出,学习源于强大的体验,而体验是心智活动的基础。智能体与世界的第一人称互动中,可能藏着一条通向超越人类智能的小径。 “经验时代”的概念由此而来。智能体对世界进行感知与交互,获取海量动态且高度定制化的数据,这种数据源将超越任何静态的合成数据生成程序,也更贴近生命的本质。就像 Sutton...
RL
西交大 x A*STAR 论文:让 AI 学会「保持一致」,多图生成迎来关键突破丨CVPR 2026
PaCo-RL:基于成对奖励与强化学习的图像一致性生成方法。 作者丨郑佳美 编辑丨岑 峰 很多人都有这样的体验:让 AI 画一个角色,第一张很好看,但第二张开始有点不一样,第三张基本就像换了个人。你让它做一套海报,单张都不错,但放在一起风格却完全不统一,再或者你让它画一个故事分镜,人物形象会一会胖一会瘦,甚至连脸都对不上,你只是改一下衣服颜色,它却顺手把脸也改了。 这些看起来像小问题,但在真实应用中却是致命的。在 IP 设计、品牌视觉、内容生产甚至工业和医疗场景中,要求的从来不是某一张图好看,而是一整组都要一致。 问题的关键在于,当前图像生成模型虽然已经从“能用”走向“高质量”,但能力仍停留在单次生成优化,也就是“单样本最优”。它擅长把一张图画好,却不知道哪些东西必须在多张图之间保持不变。换句话说,模型缺少的不是生成能力,而是一种对跨图关系的稳定建模能力,而这一能力,正是生成模型走向规模化应用的关键瓶颈。 在这一背景下,来自西安交通大学与新加坡 A*STAR 的研究团队提出了论文《PaCo-RL: Advancing Reinforcement Learning for...
热门视频
人气专家


