关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1642人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

长城汽车取消大小周,员工感慨:工作11年,终于等到全面双休了

红星资本局 浏览 1699

汇聚超千项前沿成果,第八届长三角科技成果交易博览会开幕

蓝鲸新闻 浏览 2771

《阿凡达3》票房预估214亿,195分钟一刀不剪,力争影史第一

娱乐圈笔娱君 浏览 2099

还是这些穿搭适合秋天!衣服多穿一下“基础款”,百搭又舒适

静儿时尚达人 浏览 2840

聚焦进博|中资银行“金”点子护航进博会

国际金融报 浏览 2452

林肯航海家特别版上市 一口价25.99万元

车质网 浏览 1860

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 1485

日产携左舵版N7亮相2025日本移动出行展

网易汽车 浏览 2493

何时结束战事 美以不同调:一个急于退场一个还想硬刚

环球网资讯 浏览 470

产品力全面提升 问界M7新老款车型对比

车质网 浏览 2603

诺思与您相约 IMFW 2026 第三届国际微波滤波器研讨会

爱集微 浏览 1373

消息称小鹏今年将推G01等4款新车,冲击55万-60万销量目标

IT之家 浏览 1591

小李子塞隆绝色出演,伍迪艾伦的绝妙讽刺剧

幕味儿 浏览 2039

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 1696

特朗普开价10亿美元招募 被指试图用新机构替代联合国

极目新闻 浏览 5898

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 1636

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 2404

恩智浦全新S32N7处理器释放软件定义汽车(SDV)的全部潜力

HiEV 浏览 1739

2号种子险爆冷!张本智和打满5局逆转日本悍将,8强战约战勒布伦

乒谈 浏览 2634

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 928

Nature|尺寸与光电转换效率创世界纪录,上海科学家团队携手龙头企业突破大尺寸钙钛矿光伏模组产业化关键技术

上观新闻 浏览 2819
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1