关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1640人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

惨!武术冠军自掏腰包拍武侠片,成本超1500万,4天票房仅169万

靠谱电影君 浏览 2677

中国机器人组团出征CES,加速进化首日售出数十台,魔法原子海外收入占比过半

红星资本局 浏览 1610

美制裁马杜罗家族成员 加大对委政权施压

财联社 浏览 1889

陈晓新剧黯然收官!口碑崩塌评论区沦陷?

萌神木木 浏览 2010

被演唱会上的叶倩文惊艳

喵喵娱乐团 浏览 2832

长安汽车辟谣“取消年终奖”,或发4.3月薪+3000

盖世汽车 浏览 1644

拉法口岸大批援助卡车滞留 司机:不止一次被以阻拦

北青网-北京青年报 浏览 2616

内塔尼亚胡强势点名联大离场国家 3个地区被重点提及

文汇报 浏览 4298

最「可爱」的全新酷路泽 FJ 上线,这真不是方程豹在日本失散的兄弟?

爱范儿 浏览 2610

闫妮姚晨合拍大片,梦回《武林外传》

蕾爸退休日记 浏览 2475

董子健带女儿现身公园玩 父女俩一见面就乐开花儿

翰林涛涛 浏览 2735

年度王炸爽剧,还是烂尾了

独立鱼 浏览 2671

杠上了!皇马与西甲争议盘点:点球未判、突遭药检、首轮延期被拒

直播吧 浏览 3387

中国机会|ASML:半导体产业开放合作是主流

澎湃新闻 浏览 2498

秋到没边的氛围感美甲,一眼心动

时尚COSMO 浏览 2586

春节互联网大厂红包大战背后是AI流量密码?

BT财经 浏览 1394

强生爽身粉致癌案新进展:被判赔单一原告近70亿元

红星新闻 浏览 3721

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 2357

仅用一周时间,谷歌就让OpenAI认清现实

字母榜 浏览 1510

库尼亚:我们知道这场比赛的重要性,在丢球后进球非常重要

懂球帝 浏览 1700

大疆突然降价有的便宜近1500元 有人傻眼:刚买没几天

大象新闻 浏览 17078
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1