97 个结果
智源多模态大模型登Nature,生成式人工智能路线统一到自回归
2026年1月28日,智源多模态大模型成果”Multimodal learning with next-token prediction for large multimodal models(通过预测下一个词元进行多模态学习的多模态大模型)”上线国际顶级学术期刊Nature,预计2月12日纸质版正式刊发,这是我国科研机构主导的大模型成果首次在Nature正刊发表。 2018年以来,GPT采用 “预测下一个词元(Next-token prediction,NTP)”的自回归路线,实现了语言大模型重大突破,开启了生成式人工智能浪潮。 而多模态模型主要依赖对比学习、扩散模型等专门路线,自回归路线是否可以作为通用路线统一多模态?一直是未解之谜。智源这项成果表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,对于确立自回归成为生成式人工智能统一路线具有重大意义。 https://www.nature.com/articles/s41586-025-10041-x Nature编辑点评这项研究:Emu3 仅基于预测下一个词元(Next-token...

on 2026-01-29
用第一性原理超越AlphaFold:告别蛋白质工程的「碰运气」时代
真正的突破在于让模型学会"举一反三",在3-4个突变位点的平衡木上演绎生命的无限可能。 2026年1月9日,“第四届合成生物学及生物制造大会”在深圳光明隆重召开。在“AI生物制造专场”上,华南理工大学生物科学与工程学院院长助理杨晓锋副教授做了题为《AI时代下的蛋白质设计与制造》的主旨演讲。 蛋白质作为生命的物质基础,其工程化改造不仅支撑着生物医药、化妆品等千亿级产业,更是生物制造的核心竞争点。在杨晓锋教授看来,AI for Science(AI4S)的兴起,正在从根本上重塑蛋白质从“序列设计”到“工业智造”的全生命周期。...

on 2026-02-06
津渡生科邓司伟:「AI+生物制造」到底是什么?全链智能已经实现
AI正在重塑生物制造的工艺边界,为从“实验室研究”向“大规模工业化”跨越装上“数字引擎”。 当前,生物制造已进入从“实验室研究”向“大规模工业化”跨越的关键期,而AI技术的深度介入,正在为这一进程装上“数字引擎”。 那么,全链路打通的“AI+生物制造”到底是什么?可以带来哪些突破性成果?普通生物制造类企业应该如何把握,加入AI升级大潮? 近期,“第四届合成生物学及生物制造大会”在深圳光明隆重召开。AI生物大模型引领者深圳津渡生物医学科技有限公司(以下简称“津渡生科”)受邀,其联合创始人兼首席技术官邓司伟做了题为《AI驱动的生物制造:构建从发现到生产的智能闭环》的主旨演讲。 邓司伟在报告中指出,生物智造的未来在于构建一个全链路的智能闭环,即将AI的能力渗透进科学发现、实验验证、工业生产三大阶段中,实现从研发大脑到自动化工厂的全链条智能化。...

on 2026-02-06
从「偶然发现」走向「必然创造」:AI如何重塑生物制造全链路?
揭秘AI4S如何攻克玻色因手性分离与核心限速酶稳定性难题,开启生物智造的“确定性时代”。 2026年1月9日,“第四届合成生物学及生物制造大会”在深圳光明隆重召开。在“AI生物制造专场”上,深圳瑞德林生物技术有限公司研发BG总裁,高级科学家李加忠做了题为《人工智能在合成生物领域的融合应用创新实践》的主旨演讲。当前,合成生物学已进入从“万物生长”到“万物智造”的跨越期,而 AI for Science(AI4S)...

on 2026-02-06
港大张清鹏 Nature 子刊最新研究:AI 结合血液多组学,提前 15 年预测心血管疾病风险
这项基于 UK Biobank 的研究显示,人工智能结合血液多组学信息,可系统评估未来 15 年多种心血管疾病的发生风险。 作者丨郑佳美 编辑丨岑峰 在心血管疾病预防中,一个长期存在的难题是:许多疾病在发病前已在体内潜伏多年,但要在早期准确判断一个人未来是否会同时面临多种心血管疾病风险,并不容易。以往的风险评估主要依赖年龄、血压、血脂等常规临床指标,或多基因遗传风险评分。然而心血管疾病往往是一个长期演变、可能同时出现多种结局的过程,单一指标或针对单一疾病的预测方式,很难全面反映真实风险。随着大规模人群队列和高通量分子检测技术的发展,研究者发现血液中的蛋白质和代谢物能够更直接地反映身体当前的生理状态以及疾病进程。这些分子信号不仅受到遗传因素影响,也会随环境和生活方式变化,为长期风险评估提供了新的信息来源。在此背景下,由香港大学数据科学研究院及药理与药剂学系副教授张清鹏领衔的研究团队,基于 UK Biobank...

on 2026-02-10
上交大智能计算研究院论文:不只算对答案,大模型如何真正学会运筹建模丨ICLR 2026
上海交大智能计算研究院提出 StepORLM,通过生成式过程监督提升运筹建模的整体可靠性。 作者丨郑佳美 编辑丨岑峰 在大语言模型逐步从通用推理工具走向专业领域应用的过程中,运筹优化(OR)成为一个极具吸引力、同时也极具挑战性的方向。 一方面,运筹优化问题天然具备清晰的数学结构和可验证的求解结果,看似非常适合由模型自动完成建模与求解;另一方面,真实运筹建模高度依赖变量定义、约束设计与目标函数之间的整体一致性,其推理过程往往呈现出强步骤依赖和强耦合特征,远非算出一个正确答案所能覆盖。 正是在这一张力之下,当前运筹建模大模型研究逐渐暴露出一个核心困境:模型在求解器层面得到正确结果,并不意味着其完成了正确的建模。在现有主流训练范式中,无论是仅依据最终求解结果进行奖励,还是对中间步骤进行局部、逐步的过程监督,都难以准确刻画运筹建模这种长链条推理任务的真实质量。 这种监督信号与任务本质之间的错位,使得建模错误可能被掩盖,甚至被反复强化,逐渐成为大模型走向工业级运筹优化应用的关键瓶颈。在这样的研究背景下,来自上海交通大学智能计算研究院葛冬冬、林江浩研究团队提出了《StepORLM: A...

on 2026-02-10
清华刘知远团队论文:在严格可控环境下重新回答「强化学习能否教会大模型新能力」丨ICLR 2026
强化学习改变了模型组织技能的方式,而非简单提升指标。 作者丨郑佳美 编辑丨岑峰 随着大语言模型规模和预训练强度的不断提升,强化学习在后训练阶段的角色正在发生微妙变化。 一方面,它仍然是当前提升模型推理能力和多步决策表现的关键技术手段;另一方面,越来越多的经验性结果表明,在许多任务上,强化学习带来的性能提升往往难以与“新能力的形成”直接划等号。 尤其是在 pass@k 等评测指标下,强化学习模型与基础模型之间的差距常常随着采样数的增加而迅速缩小,这使得一种观点逐渐占据上风:强化学习可能更多是在对模型内部已有解法进行筛选和重排,而非真正拓展模型的能力边界。 问题在于,这一判断本身并不容易被验证或反驳。自然语言任务中,技能边界高度交织,模型在预训练阶段所接触的数据分布几乎无法完全排除,使得性能变化很难被明确归因于能力结构的改变。在这样的环境下,关于强化学习是否“教会模型新能力”的讨论,往往停留在指标层面的解释差异,而缺乏一个能够清晰刻画技能、控制任务难度并排除干扰因素的实验基础。 正是在这样的背景下,清华大学的孙茂松、刘知远团队提出了《From f(x) and g(x) to...

on 2026-02-10
清华刘知远团队论文:最小化结构改动,短文本到长文本丝滑升级 | ICLR 2026
InfLLM-V2:通过最小结构扰动,实现大模型从短上下文到长上下文的平滑升级。 作者丨郑佳美 编辑丨岑峰 在大语言模型快速迈向更强推理能力与更复杂应用场景的过程中,“上下文长度”已经从一个模型配置参数,演变为制约系统能力上限的关键瓶颈。 一方面,长文档理解、跨轮对话记忆、复杂规划与长链式推理等任务,对模型提出了远超传统 4k 或 8k 序列长度的需求;另一方面,主流 Transformer 架构中基于全注意力机制的计算模式,在序列长度增长时不可避免地带来平方级的时间与显存开销,使得“支持更长上下文”在现实工程中迅速转化为难以承受的成本问题。 围绕这一矛盾,稀疏注意力几乎成为学术界与工业界的共识方向,但随之而来的,并不是问题的彻底解决,而是一系列新的结构性张力。...

on 2026-02-24
北大林宙辰团队论文:从数据中自适应学习时序预测损失丨ICLR 2026
QDF:以极大似然估计为起点,结合元学习思想重构预测模型损失函数,实现跨模型泛化。 作者丨郑佳美 编辑丨岑 峰 在多步时间序列预测任务中,预测性能随时间步长迅速退化几乎成为一种共识。例如:在气象预测中,短期的温度变化能够较为准确地刻画,但当预测跨度扩展至数日甚至一周时,预测误差就会逐渐放大,周期与趋势结构逐渐偏离真实轨迹。类似的问题在金融价格走势和电力负荷预测等场景中也广泛存在。 无论模型结构如何变化,当预测范围从短期扩展至中长期时,误差积累、趋势漂移和结构失真往往不可避免地出现。这类现象在实践中被频繁观察,却通常被视为模型表达能力或依赖建模不足的直接结果。 然而,与模型结构持续演进形成鲜明对比的是,多步预测在训练阶段所使用的损失函数却长期保持固定。大多数方法仍以逐时间点的均方误差(MSE)作为优化目标,默认将未来不同预测步视为相互独立且重要性一致的预测对象。...

on 2026-02-24
腾讯混元 x MBZUAI 港中文新研究:将纠错纳入策略空间,Search-R2 重构搜索增强推理学习方式
智能体性能优势并非来自更多尝试,而来自对失败路径的精确处理。 作者丨郑佳美 编辑丨岑 峰 过去几年,大语言模型的能力提升主要依赖参数和数据规模的扩张。但当模型逐步被用于研究助理、网页搜索和复杂决策支持等真实任务时,这条路径开始显露边界。 这类场景往往要求模型在开放环境中进行多轮搜索与推理,使搜索增强推理成为主流范式,同时也暴露出一个核心问题:模型在长链搜索推理中的失败,往往不是因为推理能力不足,而是无法有效处理错误在推理过程中的出现与传播。 在现实任务中,搜索结果不可避免地包含噪声,一旦早期某次检索或信息采信出现偏差,后续推理就可能在错误语义空间中不断自洽,最终生成看似合理却偏离问题的答案。然而,现有训练方法通常只依据最终答案是否正确进行优化,使“偶然成功”的轨迹与“搜索路径可靠”的轨迹获得相同反馈,长期来看反而削弱了模型对中途错误和搜索质量的约束。这也是多轮搜索、多跳推理任务中性能崩溃呈现系统性特征的重要原因。 在这一背景下,MBZUAI 、港中文和腾讯混元组成的联合团队提出了《Search-R2: Enhancing Search-Integrated Reasoning...

on 2026-02-24
相关文章