0 个结果

暂无内容
3 个结果
三大模型巨头比拼思考「幻觉」:DeepSeek 不敌 ChatGPT,Gemini 用词最少
基础模型在兼顾幻觉与推理能效上仍有很长的路要走。 作者丨郑佳美 编辑丨马晓宁 近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4...

on 2025-05-14
上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」
多模态模型在感知、理解与生成等方面的能力持续提升,但其输出中仍普遍存在与客观事实不一致的内容,即多模态幻觉现象。当模型面对信息缺失、语义含混或视觉细节复杂的场景时,往往会通过臆测进行补全,从而捏造并不存在的病灶、物体或情节。这类问题并非偶发失误,而是偏好优化训练过程中逐渐积累的结构性偏差所致:模型更容易从数量庞大、差异明显的简单样本中获得学习收益,却对真正困难、歧义性强的样本关注不足,结果是在复杂真实场景中的可靠性受到限制。围绕这一问题,上海科技大学信息科学与技术学院何旭明教授带领团队在论文《DA-DPO: Cost-efficient Difficulty-aware Preference Optimization for Reducing MLLM Hallucinations》中开展了系统研究。这项工作指出,现有偏好优化方法的核心症结不在于数据规模的不足,而在于样本难度分布失衡。为此,团队提出了 DA-DPO...

on 2026-01-28
一分钟的奇迹与幻觉:实测世界模型Happy Oyster
具备初步的世界状态跟踪能力,但不适合强约束、高可预测性的系统任务。 作者丨冯逸飞 编辑丨马晓宁 梁丙鉴 4 月 16 日,阿里发布了主打实时构建和交互的开放式世界模型产品 Happy Oyster。基于原生多模态架构,Happy Oyster 支持多模态输入与音视频联合生成,且生成过程中能够持续接收用户指令,实现画面实时响应、持续演绎。 如果说 AGI 是终极愿景,具身智能是物质载体,那么世界模型就是这一切的认知基础。它在技术脉络中占据了一个极其特殊的位置,那就是从大模型的“预测下一个词“,向”预测下一个物理状态“的演进节点。 这也让世界模型成为了一条炙手可热的赛道。16 日当天,腾讯开源了 HY-World 2.0,次日群核科技在港交所上市,成为“全球空间智能第一股“。视角拉得更远,谷歌、英伟达、Meta,以及李飞飞坐镇的 World Labs 都早就对这一赛道有所布局。 竞争逐渐升温之际,我们不禁要问,在最宏伟的愿景实现之前,有哪些先期落地场景可以为日后的争夺输血?...

on 2026-04-24
0 个结果

暂无内容
相关用户