关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2542人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

脑机接口再获突破,核心龙头布局多点开花

览富财经网 浏览 2631

特斯拉撞树后打不开车门 5人被困燃烧的车内身亡

每日经济新闻 浏览 2496

极越汽车或迎新生机!

电动知家 浏览 2261

美国对伊朗考虑"军事选项" 中方回应

澎湃新闻 浏览 1614

卫星互联网低轨 12 组卫星发射成功,长征系列火箭 600 次里程碑

IT之家 浏览 2826

一句话,干掉586亿

深蓝财经 浏览 3362

50岁女子当入殓师:有家属为抢房产要掀棺抬老人遗体

新京报 浏览 5715

可惜了,这世界第一美少年

独立鱼 浏览 2625

纽卡vs阿森纳双方公布首发

体坛周报 浏览 2645

绝望的日本车:搞新能源押错了宝,随时有可能被国产车一波推

小李车评李建红 浏览 1926

仅上任两个月!某车企董事长突然辞职

汽车工程师 浏览 1647

A股进入“两会”时间,16大热门投资赛道出炉

览富财经网 浏览 747

延世大学团队发现LLM思维路径的"均匀信息密度"密码

科技行者 浏览 2492

苏州大学突破:AI评判官能评估人工智能的记忆管理能力吗?

科技行者 浏览 1444

虚位以待!2025年宝山区博士后科研项目等你来揭榜

上观新闻 浏览 1871

爱马仕继承人,千亿家产被最好的朋友骗光

Yuki女人故事 浏览 2149

特朗普"带货"后 丰田澄清:没承诺在美投资100亿美元

环球时报国际 浏览 9003

维拉本赛季禁区外进球冠绝英超,甚至比禁区内进球还多

懂球帝 浏览 2510

光伏“卖铲人”去年净利腰斩

网易财经 浏览 1335

沈伯洋被指到处寻求"保护" 邱毅:"台独"分子们都慌了

环球网资讯 浏览 7991

婚变传闻真相大白一个月,唐嫣高调官宣喜讯

叨唠 浏览 1409
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1