关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1350人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

你有没有发现 保时捷越来越像大众了?

网易汽车 浏览 2513

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 2465

哪吒汽车“重启”新进展

大象新闻 浏览 2024

英伟达GTC大会利好兑现?CPO板块大跌

财闻 浏览 436

最高363km纯电续航 魏牌V9X远山详解

网易汽车 浏览 895

比特币暴跌超20%!43万人爆仓,加密货币市场一片“哀嚎”

北京商报 浏览 2397

再见了卡梅隆,再见了《阿凡达3》,中国观众别再被骗了

娱乐圈笔娱君 浏览 1840

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 1599

队报:马尔基尼奥斯伤病恢复慢于预期,将缺席本周法甲比赛

懂球帝 浏览 2727

上任即取大胜,新疆主帅格兰:这不是我的功劳,是球员打得好

懂球帝 浏览 1557

警方通报于朦胧坠亡,3位造谣者被处罚,调取监控排除刑事嫌疑

扒虾侃娱 浏览 3413

涉中国电动汽车,美交通部长称“加拿大会后悔”,外国网友回怼:该后悔的是美国吧!

海外网 浏览 1552

华为主导+广汽控股,华望汽车或定名“启境”,首款车型明年发布

车市红点 浏览 3413

河北公务员,干出200亿乳品王国

创业家 浏览 1410

手机动辄2亿像素,照片会撑爆内存吗?

中新经纬 浏览 2721

动力新提升 全新方程豹钛3将于上半年上市

车质网 浏览 1473

托蒂:我们那一代水平太高,很难再同时出现如此多的优秀球员

懂球帝 浏览 2374

视界大会短剧演员好尴尬!走红毯扎堆不给镜头,后台跟明星分开坐

萌神木木 浏览 2429

具身智能开启汽车产业万亿新赛道

车质网 浏览 2493

若羽臣:抖音已成为公司重要渠道之一

北京商报 浏览 1545

燃油+电动全都配 全新宝马4系最新消息曝光

乐选爱车 浏览 1387
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1