关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1432人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

190万赞的爆款女孩,等待代表作

时尚COSMO 浏览 1556

字母哥主动招募布克? 雄鹿有能力引进他吗?

仰卧撑FTUer 浏览 889

达成停火18天后战火再起 以总理下令袭击加沙

国际在线 浏览 2547

老派,但是好看

电影最TOP 浏览 1397

柬埔寨"太子集团"资产又遭冻结 豪车公寓总值超35亿元

红星新闻 浏览 14191

长友佑都:目前的巴西并非最强形态,我认为日本队有机会取胜

懂球帝 浏览 2786

美国仿制伊朗的自杀式无人机 开始在中东部署

红星新闻 浏览 2022

东华测试寻求打开机器人领域新空间

爱集微 浏览 2619

芒米Pocket Max掌机:模块化设计、大容量电池与强芯片的结合

IT之家 浏览 1583

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 2192

产品力再提升 全新雪佛兰Bolt EV新车图解

车质网 浏览 2492

苹果iOS 26.2开发者预览版Beta发布:大批功能改!锁屏也能自定义液态玻璃

快科技 浏览 2462

专家:特朗普对中国无牌可打了 没想到蠢到打起波音牌

澎湃新闻 浏览 2700

霍汶希开工派利是好热闹!谢霆锋成最大财神

无心小姐姐 浏览 913

指责俄侵犯领空 北约考虑降低开火门槛

新京报 浏览 2795

罗马诺:尤文等5队有意明格萨,塞尔塔目前不想将其出售

懂球帝 浏览 1613

曹操出行Robotaxi 2.0已搭载低轨卫星通信,将上线卫星SOS功能

IT之家 浏览 1383

特朗普:对伊朗的军事行动我们已经赢了 但还没赢够

每日经济新闻 浏览 30477

独家 | 好想来、良品铺子转型综合超市,筹划做“万市大集”

商业观察家 浏览 2830

美国对伊朗考虑"军事选项" 中方回应

澎湃新闻 浏览 1621

奇才129-126逆转雄鹿,麦科勒姆28分,KPJ空砍30分

懂球帝 浏览 2193
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1