关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2805人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俩小伙卖给美军无人机:建"无中国"供应链太难了

澎湃新闻 浏览 32308

王健林“限高”已取消,万达知情人士最新回应

红星资本局 浏览 3161

18岁松岛握拳怒吼!2连冠后豪言洛奥成主力 张本一哥席位摇摇欲坠

颜小白的篮球梦 浏览 1465

过时的拍照姿势,毁了多少普通女孩?

Yuki女人故事 浏览 4160

12月的奇迹,是“白”给的!

时尚COSMO 浏览 1558

郭磊:如何认识最新的出口数据和出口形势

首席经济学家论坛 浏览 2761

巴沙尔倒台,土耳其成最大赢家,最大输家是谁

浏览 25269

‍2025年4部新片亏8亿,古天乐终于拿出这部大片

靠谱电影君 浏览 2670

“看好中国新经济!” 渣打集团行政总裁温拓思最新发声

券商中国 浏览 2865

越遮越高级,搞穿搭原来真不看脸?

时尚COSMO 浏览 2032

香港知名女星惹同性绯闻,和朋友关系举止亲密

你约电影 浏览 1526

针对“美式讹诈”:中国为何率先发动反制?

浏览 6281

50万往上的车,还用1.5T增程器,车企穷疯了?左右逃不出3个原因

小李车评李建红 浏览 1694

莫斯科大学突破:普通照片实现房间结构与物品识别

科技行者 浏览 2634

突破“手”的瓶颈,具身智能正加速迈向“实干”

上观新闻 浏览 1937

布拉格队长:下半场我们想踢得更具威胁,但阿森纳太强了

懂球帝 浏览 2477

美军机沿伊朗边界飞行 伊朗寻求外交支持

新华社 浏览 1611

报道:欧央行官员们表示,降息周期很有可能结束了

华尔街见闻官方 浏览 1954

特朗普:内塔尼亚胡执政前景“存在不确定性”

环球网资讯 浏览 2815

外媒:俄国防部称击溃一支乌克兰特种部队

环球网资讯 浏览 2504

特朗普:我不知道还能活多久 很多人都想置我于死地

扬子晚报 浏览 37051
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1