64 个结果
MARFT:大模型多智能体强化微调范式来啦!
MARFT 微调后的大语言模型多智能体系统性能优于未经微调的系统性能和单智能体 PPO 方法,这在数学任务上得到验证并提升显著。 作者丨廖俊威、温睦宁 ...

on 2025-05-16
千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈
万台机器人比万卡集群成本更低 。 作者丨赖文昕 编辑丨陈彩娴 不久前,首届“人形机器人半程马拉松”在北京亦庄举办,为本就热度满满的具身智能行业再添了一把火。 一共 20...

on 2025-05-16
万字长文总结:DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live
AI Infra 洗牌进行时,追赶 DeepSeek 才能留在「牌桌」上。 作者丨朱可轩 编辑丨陈彩娴 DeepSeek 在进一步点燃 AI Infra 可能性的同时,也带来了新的竞争格局,在...

on 2025-05-16
浙大叶琦:建立机器人 Benchmark,为算法提供公平「竞技场」
未来机器人的操作重心将超越单纯的 pick and place,更注重「pick」后任务。 作者丨吴华秀 编辑丨陈彩娴...

on 2025-05-16
清华许华哲:具身智能需要从 ImageNet 做起吗?
...

on 2025-05-20
AIGCode宿文:我们就是要自训练大模型,直接做「L5」| AI产品十人谈
Coding 是培育大模型最好的场景。 作者丨梁丙鉴 编辑丨马晓宁...

on 2025-05-20
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈
智能体,不是生成力,而是行动力。 作者丨郑佳美 编辑丨马晓宁 在 Pokee.ai 内测之前,我们就先感受了一把这款 Agent 的能力。 “你发给我一个邮件就行,我的 Agent...

on 2025-05-20
端到端 VLA 并非唯一解:分层推理的具身基础模型 RoBridge 破解机器人「知行合一」难题
RoBridge 在显著降低训练成本的同时,显著提升开放式任务的操作鲁棒性,为破解机器人「知行合一」难题提供了可扩展的技术路径。 作者丨梁小丹、林倞...

on 2025-05-20
当AI遇上心理学:如何让AI的眼神更像人?|AAAI 2025
你有没有想过,当我们看到一幅图画并听到相关的描述时,我们的眼睛是如何“自动”跟随声音去寻找画面中的对应物?这看似自然的动作,其背后却隐藏着一套极其复杂的生理与心理机制。而今天,人工智能已经能够在一定程度...

on 2025-05-23
为什么是梁文锋做出了DeepSeek?
一个更清晰的梁文锋,一个更明白的关于DeepSeek的故事。 作者丨高允毅 编辑丨马晓宁 ...

on 2025-05-23