关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1458人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

莱斯特城2-0切尔滕汉姆,帕森-达卡破门,马维迪迪锁定胜局

懂球帝 浏览 1632

王家卫事件再次升级,可怜了这些明星

阿伧说事 浏览 2350

你的“龙虾”是否“遵规守纪”?“养虾人”速查风险

环球网资讯 浏览 490

石油巨头裹足不前的心理阴影:委内瑞拉与美国的百年石油恩怨

澎湃新闻 浏览 1652

被家暴16次女子得70%共同财产及10万赔偿 共140万余元

极目新闻 浏览 7803

美国贸易代表:想和中国再谈谈 但不谈稀土

澎湃新闻 浏览 18861

皮耶罗儿子被意丁俱乐部解约,俱乐部主席:我们不看他的姓氏

懂球帝 浏览 1950

IU李钟硕新年撒糖,两人穿情侣装低调秀恩爱

阿雹娱乐 浏览 1533

娃哈哈精密机械公司启动解散清算,员工称已收到终止劳动合同通知

红星资本局 浏览 774

上海交大突破:单一AI模型实现全视觉创作任务

科技行者 浏览 1625

行业变局信号,理想坚定AI战略

节点财经 浏览 1405

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 2170

这条裙子,今年悄悄火遍全网,冬天穿好有氛围

黎贝卡的异想世界 浏览 2115

98年翻版金城武,“正统男港星”终于又出现了

时尚COSMO 浏览 1957

一千多人牺牲结局,无法改写,但于和伟临刑前一个动作,升华全剧

皮皮电影 浏览 2637

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 3191

香港知名女星惹同性绯闻,和朋友关系举止亲密

你约电影 浏览 1526

科瓦奇谈客战拜仁:在安联球场一味退守通常不能得到好结果

懂球帝 浏览 2899

深夜,白银迭创新高!黄金也突破近6周高点

财联社 浏览 2137

一年中最不能错过的推送,超适合过年看!

黎贝卡的异想世界 浏览 902

先索尼后徕卡,为何这些国际巨头都被中国企业吞下?

BT财经 浏览 1349
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1