关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者1528人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小区因千万接口费欠款致600户居民3年未供暖 多方回应

大象新闻 浏览 7631

天翎科旗舰飞行器L600真机下线,累计获得近千架意向订单|最前线

36氪 浏览 2469

梅努的哥哥现身老特拉福德,衣服上写着“给科比-梅努自由”

懂球帝 浏览 1850

特斯拉前全球销售主管爆猛料

电动知家 浏览 2037

媒体:野田佳彦看到机会要对高市下手 高市有可能下台

新民周刊 浏览 5784

股价连跌6天,但泡泡玛特却在全球狂飙!

正解局 浏览 2614

未来四川舰、福建舰如何打配合 专家解读

环球网资讯 浏览 2277

打破垄断,光模块巨头,利润大增300%!

飞鲸投研 浏览 1338

特朗普"带货"后 丰田澄清:没承诺在美投资100亿美元

环球时报国际 浏览 9013

声音更加动听 本田全新一代混合动力系统最新消息曝光

乐选爱车 浏览 1663

大疆最大对手,要IPO

投资家 浏览 1638

重生之《泰坦尼克号》没沉

江湖人称艾掌门 浏览 608

今年最强阵容的大片,杀疯了

独立鱼 浏览 2268

特朗普:对委内瑞拉发动军事袭击计划"泄密者"已被抓

环球时报国际 浏览 12018

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 2751

西蒙菲莎大学发布:1.7万图像皮肤病变数据集训练AI诊断

科技行者 浏览 1622

郑爽近照曝光星味全无,家中装修豪华惊现儿童玩具,日子并不可怜

不八卦会死星人 浏览 1623

北京105-74大胜广东 球员评价:3人满分,7人及格,2人低迷

篮球资讯达人 浏览 1793

E句话| 他们都离婚了?

仙女事件簿 浏览 2255

追觅汽车三款SUV车型外观亮相:星际T08、T08L和D09

IT之家 浏览 1282

开拓者7人上双114-95轻取篮网,阿夫迪亚18+6+5,克林根14+11

懂球帝 浏览 480
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1