关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2473人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

还是王慧文有眼光,Kimi又融了35亿

字母榜 浏览 1811

小米成都车祸引解锁争议 打不开的电动车门成监管焦点

界面新闻 浏览 7007

用她和朱珠比较,不太公平?

江湖人称艾掌门 浏览 2381

50+女人的穿搭封神技巧来了,抓准这4点,轻松穿出简约高级感

静儿时尚达人 浏览 1580

“量子科技第一股”董事长离世余波调查:已排除是刑事案件

时代周报 浏览 1858

特朗普开价10亿美元招募 被指试图用新机构替代联合国

极目新闻 浏览 5850

妈耶!这一冬天都笑疯了!真受不了这喷饭综艺有人不知道

娱乐圈笔娱君 浏览 1676

斯塔默:允许美使用英方有关军事基地打击伊朗导弹设施

环球网资讯 浏览 40861

岚图追光L/别克至境世家领衔 12月上市新车汇总

太平洋汽车 浏览 2124

债市,大调整!

米筐投资 浏览 2075

上海校园餐背后的供应商,越挖越让人心惊!

功夫财经 浏览 3547

股市:更大的想象空间来了

小白读财经 浏览 1371

中国海警:菲方侵闯中国领海 故意冲撞中国海警船

央视新闻客户端 浏览 3398

特朗普称已考虑接替穆杰塔巴的人选 外交部表态

潇湘晨报 浏览 31253

两会对话|商汤徐立:建议推动AI工具的公共职业化培训,促进就业形态多元化发展

澎湃新闻 浏览 1336

77亿的工厂16亿卖 自主“捡漏”合资产能背后的车市剧变

道哥说车 浏览 2236

曼联传奇警告梅努绝不能租借离队

绿茵情报局 浏览 1598

安东尼奥3年2次突破!成05国奥主帅热门,媒体人:结果大于过程

奥拜尔 浏览 1648

日本自卫队高强度"尾随"中国海军 真实水平被试出来了

空天力量 浏览 13016

大众汽车营收微降却亏麻了,利润腰斩暴跌53.5%!

财视传播 浏览 656

网红坠机起火身亡 村民:我们赶到时人还绑在飞机上

封面新闻 浏览 36172
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1