关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1615人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电续航215km 极狐阿尔法T5增程版官图发布

车质网 浏览 2315

震惊世界的3小时:美国“闪击”委内瑞拉的事实与疑问

南方都市报 浏览 1723

腾讯集团高级副总裁郭凯天:坚持智能向善,构筑人与AI的信任机制

上游新闻 浏览 2517

欧洲对美方"28点计划"逐一删改 令俄罗斯舆论颇为不满

环球网资讯 浏览 15143

网飞开年第一爆剧来了,快去看

独立鱼 浏览 1481

澳网最具看点女单比赛来了!莱巴金娜谈迎战斯瓦泰克:保持进攻

网球之家 浏览 1441

政务大模型部署,重磅文件印发

智东西 浏览 2308

官方:乌兹别克斯坦裁判纳贾法列夫将执法海港客战武里南联

懂球帝 浏览 2496

4名游客遭马蜂袭击送医抢救:满头被蜇 头发都剃光了

极目新闻 浏览 6310

女子毕业24年后起诉母校多收4000元学费 要求退一赔十

大风新闻 浏览 19530

针织+半裙,秋天最经典搭配,好看又减龄!

LinkFashion 浏览 3623

“这件衣服”今年春天太流行了!谁穿谁好看

LinkFashion 浏览 904

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 2507

邓莎每个月生活费曝光,路行一个字都没有说错

贵州小娟 浏览 2540

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 2194

因家人病危,布里斯班狮吼主教练将缺席下轮联赛

懂球帝 浏览 1585

蒋欣节目中直言自己没人追,理想型竟然是他!

青史楼兰 浏览 2389

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 1770

E句话|《怦然心动》的导演,被儿子杀死 ?

仙女事件簿 浏览 1580

朱光耀:中美AI实力对比,中国具备三项优势

上观新闻 浏览 1858

阿尔特“AI+数智创造”,汽车设计革命前夜?

禾颜阅车 浏览 1650
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1