关闭广告

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者1572人阅读


这项由东南大学计算机科学与工程学院的陈慧怡、彭佳伟、杨旭等研究人员,联合同济大学国豪学院陈凯杰,以及伊利诺伊大学芝加哥分校的闵德海、孙常昌、严岩、程璐等学者共同完成的突破性研究,于2024年11月发表在arXiv预印本平台(编号:arXiv:2511.14159v1)。研究团队首次创建了专门用于评估大型视觉语言模型(类似于能看图说话的AI系统)在面对视觉误导时表现的综合性测试基准。

要理解这项研究的重要性,我们可以把AI模型比作一个正在学习观察世界的学生。过去,研究人员主要关注的是如何通过文字来"误导"这个学生,就像给他一个包含错误信息的题目。然而,在现实世界中,视觉本身就经常带有欺骗性——就像我们有时会把远处的灯光误认为星星,或者在昏暗的光线下把一把椅子看成人影。这种视觉上的"错觉"对AI来说同样是个挑战,但此前却很少有人系统性地研究过这个问题。

研究团队发现,现有的AI模型评估基准主要集中在两个方面:一是检测AI是否会产生"幻觉"(即编造不存在的内容),二是测试它们对恶意攻击的抵抗能力。然而,这些测试都忽略了一个关键问题:当视觉信息本身就容易产生误解时,AI会如何表现。这就像我们一直在测试学生能否正确回答

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

门多萨:为马竞效力是儿时梦想,身边队友小时候在电视上看过

懂球帝 浏览 1317

小米车主第1天提车在交付中心撞人 小米内部人士回应

澎湃新闻 浏览 18351

如何在全球高端设备领域掌握话语权?“深圳智造”又传喜报

南方都市报 浏览 2558

王楚钦低调现身演唱会!全场观众疯狂尖叫

小椰的奶奶 浏览 3359

新一代理想L9电池加码体型加大 重夺高端话语权

网易汽车 浏览 1490

富勒姆怒斥曼联第一球不应存在,炮轰天大误判!英超官方解释原因

罗米的曼联博客 浏览 1366

玩换电,推增程,埃安到底要干什么

汽车公社 浏览 2315

飞天茅台4年下跌近50%,白酒寒冬结束的信号是什么?

郭施亮 浏览 2463

保剑锋被前妻手撕,不愧是插刀教成员

萌神木木 浏览 1404

CES2026开幕,英伟达黄仁勋提到多个中国大模型,这些中国产品将亮相

文汇报 浏览 1715

优质IPO企业站上资本C位

北京商报 浏览 1967

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 2463

美国一"深红"选区爆冷翻蓝 特朗普选后立即撇清关系

上观新闻 浏览 8167

游戏规则变了,Stellantis或用中国技术再造Jeep

禾颜阅车 浏览 2570

强化AI编程能力迎战谷歌!OpenAI发布GPT-5.2-Codex,软件工程和网安一把抓

华尔街见闻官方 浏览 1973

印度电动汽车市场:名爵份额逼近塔塔

车质网 浏览 2674

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 2800

黄一鸣宣布新恋情,王思聪或成过去式

赵昉是个热血青年 浏览 1775

抠门年轻人,开始流行买“顶配猫砂”

DT商业观察 浏览 2386

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 12214

中国足协第十二届会员代表大会第三次会议召开

体坛周报 浏览 1593
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1