关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1429人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《日掛中天》首波口碑!剧情被质疑渲染苦难,辛芷蕾演技获肯定

萌神木木 浏览 2462

长城汽车发布归元平台,穆峰称坚决不做增程式

贝壳财经 浏览 1503

对话“死了么”App创始人:这几天付费人数翻了200倍;另有“活了么”App上线

红星资本局 浏览 1604

美媒:美军紧急出动F-16战机飞越叙中部城市上空"展示武力"

环球网资讯 浏览 2051

仅10%援助卡车获准进入 加沙地带饥荒危机加剧

极目新闻 浏览 2649

“军国主义”为何能在日本存续下来

国际在线 浏览 2158

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 32283

猎奇智能IPO背后藏着七大富豪!80后湖北大佬造光模块设备年入5亿

野马财经 浏览 1304

李安新片《金山》停摆!好莱坞变了天

草莓解说体育 浏览 2052

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 3350

美国已正式开始出售委内瑞拉石油

新京报 浏览 1630

驻韩美军一“死神”无人机失控坠海 9月才被部署在朝鲜半岛

红星新闻 浏览 2174

3年半亏损289亿,华侨城A换帅,人均薪酬15.5万元

华美财经 浏览 3452

MIT所长涉嫌图片操纵,《自然》发布关注声明

知识分子 浏览 3220

俄称乌企图袭击普京官邸

界面新闻 浏览 1717

32岁杨紫又“变脸”,皮肤紧致一脸高原红,重回“锦觅”颜值巅峰

温柔娱公子 浏览 3287

现在宝马5系只要30万出头!中期改款前脸大改,这颜值值得等~

蜗牛车志V 浏览 1392

今日热点:车银优代言广告被隐藏;《巅峰对决》主演担任米兰冬奥会火炬手……

伊周潮流 浏览 1463

国资券商整合收官!新国盛证券承接所有业务,原主体完成工商注销

21金融圈 浏览 1311

年度王炸爽剧,还是烂尾了

独立鱼 浏览 2666

硬核揭秘!福建舰“一马当先”底气何在

环球网资讯 浏览 962
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1