关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2814人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗总统:战争既不符合伊朗也不符合美国利益

国际在线 浏览 1320

“这顶帽子”太火了,今年流行的风格都离不开它

LinkFashion 浏览 1609

《共和报》评意大利杯:“是机会还是阻碍?”

绿茵情报局 浏览 1434

荷兰政府对闻泰科技安世半导体下手 中资股权仅剩1股

蓝鲸新闻 浏览 2711

莱斯特城2-0切尔滕汉姆,帕森-达卡破门,马维迪迪锁定胜局

懂球帝 浏览 1638

推广中奖名单-更新至2025年11月5日推广

黎贝卡的异想世界 浏览 2040

德媒封面:5位欧洲领导人手持武器 配文"唐纳德够了"

每日经济新闻 浏览 21569

脱口秀演员王越确诊甲状腺癌 手术后晒照报平安

红星新闻 浏览 6003

潘江:大家的思想包袱还是太重,希望奈特能保持这样的状态

懂球帝 浏览 1634

零件细节曝光 新款奔驰S级将于2026年推出

车质网 浏览 1847

深度解读“碱基编辑技术”:首个定制基因编辑疗法案例获成功

DeepTech深科技 浏览 1528

央视一姐董卿“陨落”!51岁的她成于自己

君笙的拂兮 浏览 3246

泽连斯基新年致辞:不要"乌克兰的终结"

中国经济网 浏览 1756

阿尔伯塔大学新突破:让AI学会自我检查错误,准确率远超人工审核

科技行者 浏览 1676

男生遭老师按地上强制要求剪头发 被老师勒脖子骑身上

大风新闻 浏览 6946

卡瓦哈尔谈国家德比:我们渴望复仇,击败他们意义重大

懂球帝 浏览 2665

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 2756

《逍遥》大结局:秉烛结束了红烨,肖瑶曾为妖王!

肆季娱乐 浏览 1712

比变老更可怕的是不会穿!中年女人掌握4个技巧,优雅不费力

静儿时尚达人 浏览 1603

美媒:乌方认为美对乌施压力度远大于对俄 美官员否认

环球网资讯 浏览 2030

金银"大跳水" 深圳水贝有档口单日卖出200万元金条

红星新闻 浏览 6077
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1