关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3387人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曾获专班支持的“座上宾”,如今被追要1.4亿元投资款!光伏龙头50亿元项目推进不利,收地方政府“听证通知书”

每日经济新闻 浏览 1799

50、60岁的女人就要这么穿!自然老去,不扮嫩反而更美了

静儿时尚达人 浏览 2691

牛弹琴:英国"动真格"了 王子被"大义灭亲"剥夺头衔

上游新闻 浏览 13483

奇才120-103尼克斯,巴格利18+11,亚布塞莱11分,克拉克森12分

懂球帝 浏览 2694

CBA再无全胜球队!广东31分惨败北京,最新积分榜:卫冕冠军登顶

侃球熊弟 浏览 1820

猛龙7人上双四杀老鹰:巴恩斯18+8+10 杰伦13+14+7+6失误

醉卧浮生 浏览 1678

皇马巴萨决裂:佛爷&拉波尔塔取消午餐会 卡瓦哈尔愤怒约谈亚马尔

风过乡 浏览 2576

丹麦羽毛球公开赛今日打响,石宇奇迎来世锦赛后首次亮相

懂球帝 浏览 2781

马克龙透露约20国将组建"威慑部队" 以保障乌克兰安全

看看新闻Knews 浏览 32015

郑丽文再称"大陆是我们的亲人" 民进党直接跳脚

扬子晚报 浏览 7587

明略科技通过聆讯:上半年营收6.4亿,经调整利润转正 腾讯是股东

雷递 浏览 2807

直播间人气冲2万,云朵当众叫爸爸

乡野小珥 浏览 2358

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 2610

豪门赘婿,惨被退货?

仙女事件簿 浏览 2643

至高6000元购车红包 长安启源推限时购车福利

网易汽车 浏览 809

汪小菲要把满月儿子绑在身上坐飞机?马筱梅急了

喜欢历史的阿繁 浏览 746

对阵纳什维尔3球1助,梅西达成连续17年上演帽子戏法成就

懂球帝 浏览 2348

剖析智元机器人:一场关于人才与资本的博弈

虎嗅APP 浏览 2723

3月5日将上市 比亚迪海豹07EV有望搭载闪充技术

网易汽车 浏览 785

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 2132

印媒怒了:美国人组团恶意抢机票 阻止印度人返回美国

环球时报 浏览 26085
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1