关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2422人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

海港战町田泽维亚海报:象棋将军局,谋定后动

懂球帝 浏览 2519

美国政府进入史上"停摆"最长时间 特朗普表态

红星新闻 浏览 15163

阿尔特塔:我们会对英联杯全力以赴;热苏斯的斗志非常出色

懂球帝 浏览 1879

小米车主第1天提车在交付中心撞人 小米内部人士回应

澎湃新闻 浏览 18351

18岁少年鳌太线失联超10天 搜救队再次进山展开搜救

红星新闻 浏览 8011

取款被查流水 银行涉嫌侵犯个人隐私

南方都市报 浏览 2323

英伟达CEO黄仁勋:“上帝级AI”还很遥远,但世界仍需向前发展

IT之家 浏览 1597

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 3402

何小鹏的“回旋镖”与超级增程的“阳谋”

1号车盟 浏览 1938

E句话|《怦然心动》的导演,被儿子杀死 ?

仙女事件簿 浏览 1576

事实证明,被向太“戳破”婚变的窦骁,早就找好了退路

温柔娱公子 浏览 2603

Vogue这一夜太抓马了

细语 浏览 2469

福建舰已完成多次海试 进度远超预期

央视新闻客户端 浏览 2491

猫头鹰联手Prusa推出经典棕色、米色3D打印PLA耗材

IT之家 浏览 2071

提升科技股估值容忍度 掘金AI“从1到10”爆发机遇

证券时报 浏览 3350

美军猛烈轰炸后 特朗普暗示或发起"踩红线"打击

界面新闻 浏览 74515

有人被拖欠工资!毫末智行北京总部人去楼空,员工抱着显示器离开;曝ASML为美国监控中国客户!官方否认;雷军斥资超1亿港元增持小米

雷峰网 浏览 2153

美股科技七巨头风光不再

第一财经资讯 浏览 914

包括氢动力版本 宝马全新一代X5最新消息曝光

乐选爱车 浏览 3218

专家:高市早苗收敛了一贯对华强硬的鹰派色彩

北京日报客户端 浏览 13297

陈乔恩老公首公开真实家境

小先生笔记 浏览 2505
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1