Gairdao Community

Loading...

0 个结果

暂无内容

2 个结果

最新 AGI 暴论：强化学习RL的「GPT-3 时刻」实现，还需要 1 万年？

「复制训练」或许是一条推动 RL 模型走向通用智能的重要路径。编译丨郑佳美编辑丨陈彩娴最近，国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文，提出一个大胆的判断：RL 或许要迎来属于它的 “GPT-3 时刻”，但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。在他们看来，当前的 RL 模型还存在明显短板，比如泛化能力差、难以适应新任务等，这种局面其实很像 GPT-3 出现之前的语言模型 — — 能解决特定问题，但难以迁移和扩展。为了解决这个问题，他们提出了一种新的训练范式，叫作“复制训练”（Replication Training）：让模型在虚拟环境中模拟真实软件的操作过程，比如使用浏览器、编写代码、处理命令行任务等等。这种训练方式的好处在于任务目标清晰、评分机制明确，同时还能大规模自动生成训练数据，非常适合用在 RL 模型的系统性训练中。当然，它也不是万能的，比如在任务开放性和测试设计方面还有一些挑战。但他们认为，复制训练是一条能推动 RL 模型走向通用智能的重要路径，有望带来一次类似 GPT-3 那样的能力跃迁。综上，AI...

on 2025-09-04

从李飞飞直播到老黄女儿首秀：英伟达在下一盘什么大棋？

英伟达的下一幕：不谈 GPU，而谈「造世界」。作者丨郑佳美编辑丨马晓宁最近，英伟达又成了话题中心。短短几天里，接连两场看起来毫不相干的活动持续刷屏，一场是斯坦福教授李飞飞和英伟达首席科学家 Jim Fan 的直播，对谈主题是“让 AI 学会在世界里行动”，而另一场黄仁勋的女儿、英伟达产品营销高级总监 Madison Huang 首次公开亮相，与光轮智能（Lightwheel）创始人谢晨展开对话，共同探讨仿真、具身智能与 Sim2Real 的未来。两场活动一边属于学术界的象征，一边则是产业界的未来接班力量。但当我们把它们放在一起看时，会发现它们其实讲述的是同一件事：英伟达正在全力推进它的仿真计算机战略。这是黄仁勋为未来十年定下的方向：用 Omniverse、Isaac Sim 和 Physical AI 三大支柱，去构建一张贯穿虚拟与现实的“智能物理世界计算网”。简单来说，英伟达想要打造的不只是更强的算力，而是一套让 AI 能够“在世界中学习与行动”的系统，让机器不止能理解数据，而是真正学会理解世界本身。英伟达正在下很大一盘棋。 01 三台「计算机」的新格局 ...

on 2025-10-21

4 个结果

AI+手语识别，技术革新与应用前景

Agent 元年已至，我们会拥有自己的智能助理吗？

ACL 2025： Chinese Inertial GAN for Handwriting Signal Generation and Recognition

智算市场变局下的生存法则：从现状解析到产业链破局之道

User Profile