关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3397人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI的“相变”时刻:为什么我们现在的想象力都太贫乏了?

澎湃新闻 浏览 1542

国产GPU厂商燧原科技科创板IPO获受理 拟融资60亿

网易财经 浏览 1450

宁德时代第三季营收1042亿:同比增12.9% 净利185亿斥资800亿理财

雷递 浏览 2355

当智能体爆发在即,数据库如何成为“发动机”?

科技行者 浏览 1561

售30.98万起 新款享界S9/S9T亮相广州车展

网易汽车 浏览 2278

乔治亚理工学院联手微软:让AI训练效率暴增21%的神奇新方法

科技行者 浏览 2376

E句话|《怦然心动》的导演,被儿子杀死 ?

仙女事件簿 浏览 1580

章泽天给所有想嫁豪门的女人上了一课

白面书誏 浏览 2470

秋季上市 2026款大众ID. Cross谍照曝光

车质网 浏览 478

长安汽车董事长朱华荣:预计到 2030 年,L2 辅助驾驶将成为标配

IT之家 浏览 2705

杨紫,值得一个肯定!

星寒新影视 浏览 1324

49 岁马伊琍公布喜讯,终于等到这一天

动物奇奇怪怪 浏览 2483

曾获专班支持的“座上宾”,如今被追要1.4亿元投资款!光伏龙头50亿元项目推进不利,收地方政府“听证通知书”

每日经济新闻 浏览 1811

一天两枚火箭发射失利 中国航天科技集团发文回应

每日经济新闻 浏览 5784

11场0球0助!利物浦1.3亿巨星不服被批:前面只是适应 别总盯着我

风过乡 浏览 2468

看了这些日系穿搭才知道,还是西装和衬衫最靠谱,舒适大方

静儿时尚达人 浏览 2491

首款可折叠iPhone最新消息:或在2026年秋季发布

环球网资讯 浏览 2092

U17世界杯吉祥物灵感来自前国足主帅米卢,米卢:感谢这个创意

懂球帝 浏览 2511

拜仁26/27赛季客场球衣谍照:白色主色调,队徽内EV字样回归

懂球帝 浏览 2718

财经早餐:英伟达50亿美元收购英特尔股份;美股三大指数齐创历史新高

网易财经 浏览 3474

百日破十万!比亚迪海狮06改写爆款规则,海洋网的成长密码

大象新闻 浏览 2439
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1