关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者1582人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

又赢了!19岁国乒黑马绝杀日本后势不可挡 高情商发言存大将之风

颜小白的篮球梦 浏览 2206

痛经的女性,正在猛灌中男“保健酒”

她刊 浏览 1914

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 44893

小米集团宣布最高25亿港元的自动股份回购计划并将注销

网易财经 浏览 1523

输深圳采访!杨鸣满意表现,苦恼调整空间不大,谈下场给小将机会

篮球资讯达人 浏览 1588

卡塔尔正式投诉以色列:公然侵犯主权 违反国际公约

上观新闻 浏览 3293

女友BELLA+封面 | SUPER JUNIOR银赫:二十年初心的破茧之旅

伊周潮流 浏览 4145

山东99-75战胜宁波 球员评价:3人优秀,5人及格,2人低迷

篮球资讯达人 浏览 1439

泰国为何“硬刚”特朗普 非要把仗打到底?

上观新闻 浏览 1675

竟然人VS居然人,这是什么新标签?

时尚COSMO 浏览 2296

雅斯特酒店回应房客发病送药不及时死亡:送药者未告知病情,隐私考虑未查看药品

封面新闻 浏览 2153

你算老几?我算老己!

时尚COSMO 浏览 1898

日本平台征集"批评中国"视频每条180元 日本网民炸锅

极目新闻 浏览 12950

打破29个月冠军荒!梅总终于赢了!

网球之家 浏览 2745

北约下周军演 将模拟可能动用核武器场景

界面新闻 浏览 2708

俄罗斯终于发现 福建舰服役后做中国的朋友很有面子

现代小青青慕慕 浏览 7019

又一位香港老戏骨离世

皮皮电影 浏览 2436

捷途梁海明:“四个坚持”破局 用户共创+战略深化启新程

网易汽车 浏览 2085

将于2027年上市 AMG CLA猎装车谍照曝光

车质网 浏览 1531

哥伦比亚大学团队推出全球首个网络音视频文化理解基准

科技行者 浏览 1409

以军再袭约旦河西岸 巴方谴责以“吞并”企图

国际在线 浏览 2077
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1