关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2489人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

9岁小酒窝,大大方方成顶流

时尚COSMO 浏览 2310

日方鼓吹拥核 国防部表态

环球网资讯 浏览 1629

大众帕萨特裸车价11.85万起!网友:这还考虑啥?

汽车网评 浏览 1953

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 438

石破茂发表战后80年"个人见解" 专家:需要政治勇气

环球网资讯 浏览 2875

女子被日料店服务员泼开水烫伤:事发后曾接到警告电话

封面新闻 浏览 7817

俄黑海港口设施遭袭,乌军证实实施火力打击

潇湘晨报 浏览 2436

美国宣布针对伊朗实施新一轮制裁

上观新闻 浏览 1408

向科米索的最后告别:富纳罗、费拉利、普拉德等人将在美国出席

绿茵情报局 浏览 1590

61岁华西女教授创业冲刺港股IPO,估值超34亿元,腾讯、启明等参股

红星资本局 浏览 1563

对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

硅星人 浏览 2236

江汽集团董事长项兴初拜访华为任正非,进一步拓宽合作领域

财闻 浏览 1859

宝利德破产听证后官司缠身 昔日豪车经销商驶向何方

财闻 浏览 2441

开局2026,企业家的坚守与求变|封面故事

中国企业家杂志 浏览 1686

两会对话|商汤徐立:建议推动AI工具的公共职业化培训,促进就业形态多元化发展

澎湃新闻 浏览 1341

委内瑞拉下令搜捕美国侵略支持者

澎湃新闻 浏览 1696

搭载VLA大模型 魏牌全新蓝山智能进阶版年内上市

网易汽车 浏览 2045

特朗普按下葫芦亲自去浮瓢:巴以未了结 俄乌又点炮

新民晚报 浏览 6138

乌称1200名乌被俘人员将获释 俄方暂无回应

新京报 浏览 2319

夸克AI眼镜开售,88VIP叠加9折消费券,最低3329元

海外网 浏览 2744

智能化升级 新款卡罗拉锐放限时售9.68万起

网易汽车 浏览 2324
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1