0 个结果

暂无内容
2 个结果
最新 AGI 暴论:强化学习RL的「GPT-3 时刻」实现,还需要 1 万年?
「复制训练」或许是一条推动 RL 模型走向通用智能的重要路径。编译丨郑佳美编辑丨陈彩娴最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型 — — 能解决特定问题,但难以迁移和扩展。为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。这种训练方式的好处在于任务目标清晰、评分机制明确,同时还能大规模自动生成训练数据,非常适合用在 RL 模型的系统性训练中。当然,它也不是万能的,比如在任务开放性和测试设计方面还有一些挑战。但他们认为,复制训练是一条能推动 RL 模型走向通用智能的重要路径,有望带来一次类似 GPT-3 那样的能力跃迁。综上,AI...

on 2025-09-04
从李飞飞直播到老黄女儿首秀:英伟达在下一盘什么大棋?
英伟达的下一幕:不谈 GPU,而谈「造世界」。 作者丨郑佳美 编辑丨马晓宁 最近,英伟达又成了话题中心。 短短几天里,接连两场看起来毫不相干的活动持续刷屏,一场是斯坦福教授李飞飞和英伟达首席科学家 Jim Fan 的直播,对谈主题是“让 AI 学会在世界里行动”,而另一场黄仁勋的女儿、英伟达产品营销高级总监 Madison Huang 首次公开亮相,与光轮智能(Lightwheel)创始人谢晨展开对话,共同探讨仿真、具身智能与 Sim2Real 的未来。 两场活动一边属于学术界的象征,一边则是产业界的未来接班力量。但当我们把它们放在一起看时,会发现它们其实讲述的是同一件事:英伟达正在全力推进它的仿真计算机战略。 这是黄仁勋为未来十年定下的方向:用 Omniverse、Isaac Sim 和 Physical AI 三大支柱,去构建一张贯穿虚拟与现实的“智能物理世界计算网”。简单来说,英伟达想要打造的不只是更强的算力,而是一套让 AI 能够“在世界中学习与行动”的系统,让机器不止能理解数据,而是真正学会理解世界本身。 英伟达正在下很大一盘棋。 01 三台「计算机」的新格局 ...

on 2025-10-21