关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1609人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国乒女双夺冠女单却陷泥沼:8强仅杨屹韵1人 日乒4将围剿张本领衔

颜小白的篮球梦 浏览 2606

波兰称考虑禁止中国电动汽车进入其军事基地 中方回应

财联社 浏览 5917

珍珠专场|| 无论20+还是60+,一定都会对它心动!

黎贝卡的异想世界 浏览 4458

国资券商整合收官!新国盛证券承接所有业务,原主体完成工商注销

21金融圈 浏览 1311

俄外交部:扎波罗热核电站归属俄罗斯不容置疑

上观新闻 浏览 3451

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 1448

十分亮眼,阿马德5场非洲杯比赛贡献3球1助,3次获得全场最佳

懂球帝 浏览 1572

《再见爱人5》收官,评论区被骂翻

白面书誏 浏览 1579

内塔尼亚胡:对伊朗的打击以军已部署全部力量

参考消息 浏览 38732

向华强说娱乐圈明星美女他看不上眼:极致宠溺背后的事业共生学

互联观察联盟 浏览 1525

港媒:中美达成共识后,荷兰在接管安世问题上进退两难

环球时报国际 浏览 2614

一款车就给吓成那样?某全球车企掌门人:比亚迪,是个巨大的威胁

小李车评李建红 浏览 2576

Thinking Machines人事风波全复盘:冲刺500亿美元估值添变数

DeepTech深科技 浏览 1491

红毯走成这样,也太抽象了……

严肃八卦 浏览 1799

北京78-93天津 球员评价:3人优秀,3人及格,4人低迷

篮球资讯达人 浏览 1398

爆冷输吉林!王博纯犯错!用人+暂停一塌糊涂,上全华班都能赢!

篮球资讯达人 浏览 1371

10位院士与会 2025中国自动化大会成功举行

网易科技报道 浏览 2803

委内瑞拉空军基地遭美袭击后 导弹碎片四散

极目新闻 浏览 1642

搭猎鹰500辅助驾驶 全新奇瑞QQ3将于4月上市

车质网 浏览 1498

5名共和党议员"倒戈" 特朗普"愤怒"向其打电话威胁

环球网资讯 浏览 12240

普通人穿衣不需要太复杂!颜色恰当、搭配和谐,高级又耐看

静儿时尚达人 浏览 732
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1