爆点资讯

这项由东南大学计算机科学与工程学院的陈慧怡、彭佳伟、杨旭等研究人员，联合同济大学国豪学院陈凯杰，以及伊利诺伊大学芝加哥分校的闵德海、孙常昌、严岩、程璐等学者共同完成的突破性研究，于2024年11月发表在arXiv预印本平台（编号：arXiv:2511.14159v1）。研究团队首次创建了专门用于评估大型视觉语言模型（类似于能看图说话的AI系统）在面对视觉误导时表现的综合性测试基准。

要理解这项研究的重要性，我们可以把AI模型比作一个正在学习观察世界的学生。过去，研究人员主要关注的是如何通过文字来"误导"这个学生，就像给他一个包含错误信息的题目。然而，在现实世界中，视觉本身就经常带有欺骗性——就像我们有时会把远处的灯光误认为星星，或者在昏暗的光线下把一把椅子看成人影。这种视觉上的"错觉"对AI来说同样是个挑战，但此前却很少有人系统性地研究过这个问题。

研究团队发现，现有的AI模型评估基准主要集中在两个方面：一是检测AI是否会产生"幻觉"（即编造不存在的内容），二是测试它们对恶意攻击的抵抗能力。然而，这些测试都忽略了一个关键问题：当视觉信息本身就容易产生误解时，AI会如何表现。这就像我们一直在测试学生能否正确回答

东南大学团队首次揭示：视觉欺骗如何让AI＂看走眼＂

克洛普：斯洛...

沪指4000...

统治力！罗诗...

巴黎人报：出...

市场博弈美联...

莱因克尔：对...

特朗普：希望对伊朗的军事打击快速且具决定性

不必悲观！券商发声：相比4月，预计冲击更小！

美国宣布对伊朗最新制裁措施

门多萨：为马竞效力是儿时梦想，身边队友小时候在电视上看过

小米车主第1天提车在交付中心撞人小米内部人士回应

如何在全球高端设备领域掌握话语权？“深圳智造”又传喜报

王楚钦低调现身演唱会！全场观众疯狂尖叫

新一代理想L9电池加码体型加大重夺高端话语权

富勒姆怒斥曼联第一球不应存在，炮轰天大误判！英超官方解释原因

玩换电，推增程，埃安到底要干什么

飞天茅台4年下跌近50%，白酒寒冬结束的信号是什么？

保剑锋被前妻手撕，不愧是插刀教成员

CES2026开幕，英伟达黄仁勋提到多个中国大模型，这些中国产品将亮相

优质IPO企业站上资本C位

女星安吉丽娜·朱莉访乌其随身保镖被乌军征兵处抓走服役

美国一＂深红＂选区爆冷翻蓝特朗普选后立即撇清关系

游戏规则变了，Stellantis或用中国技术再造Jeep

强化AI编程能力迎战谷歌！OpenAI发布GPT-5.2-Codex，软件工程和网安一把抓

印度电动汽车市场：名爵份额逼近塔塔

洪九果品响退市警报，“榴莲大王”梦断资本路

黄一鸣宣布新恋情，王思聪或成过去式

抠门年轻人，开始流行买“顶配猫砂”

中国联通原副总经理获刑12年曾搞权色、钱色交易

中国足协第十二届会员代表大会第三次会议召开