关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2649人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

服装AB版带货套路:消费欺诈不能成行业“潜规则”丨中听

大象新闻 浏览 2391

文淇签约陈坤周迅舒淇公司,成为张婧仪同事

师维 浏览 1307

湖北武汉加速构建人形机器人产业发展生态

新华社 浏览 2497

德国财长访问中国备受关注 德媒:此行意义重大

环球时报国际 浏览 44312

清华姚班大神陈立杰,联手00后逆向破局!颠覆50年计算机难题

新智元 浏览 2226

塞尔:马竞内部认为之后引进的球员必须在实力上优于离队者

懂球帝 浏览 1538

广汽功臣肖勇让位,埃安、杨龙能否相互成全?

车友观察 浏览 3362

6名中国男子日本滑雪被困获救 救援费为每人100万日元

极目新闻 浏览 5705

人到中年别硬凹“少女感”,无龄感穿搭才是王道,优雅显贵

静儿时尚达人 浏览 1807

成为新公路之王!极氪8X预售37.68万元起

网易汽车 浏览 484

北京越野BJ40增程大电池版实车图曝光

车质网 浏览 1930

马杜罗出庭:站立姿势被指有对抗意味 钢笔被法警夺走

澎湃新闻 浏览 5200

潘江:大家的思想包袱还是太重,希望奈特能保持这样的状态

懂球帝 浏览 1634

银行批量直售房产 价格从几万元到几亿元不等

经济观察报 浏览 8798

小米汽车560平米超大商超体验店开业

CAR路里 浏览 2512

向五角大楼匿名捐赠1.3亿美元"军饷"的富豪身份披露

鲁中晨报 浏览 8068

苏州一企业愿无偿为嫣然医院提供场地 负责人:将详谈

潇湘晨报 浏览 5445

奥特曼的“印钞机”与“吞金兽”:OpenAI年化营收超200亿美元背后的豪赌

澎湃新闻 浏览 1567

鸿蒙智行"9系"扩容 首款MPV智界V9来了

网易汽车 浏览 2012

10月车企交付数据汇总:小米小鹏均超4万,零跑破7万

三言科技 浏览 2421

谁说何老师老了?!

时尚COSMO 浏览 2551
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1