首页 > 百姓社区 > 百姓社区 > NeurIPS Spotlight|运动遮挡都不怕,一段视频精准预测相机参数

NeurIPS Spotlight|运动遮挡都不怕,一段视频精准预测相机参数

发布时间:2025-09-26 16:22:12来源: 13899775532

论文一作李放,美国伊利诺伊大学香槟分校 (UIUC) 博二学生,研究方向为 4D 视觉定位、重建/新视角合成以及理解。第二作者为美国伊利诺伊大学香槟分校博四学生张昊。通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor(Ming-hsuan Yang, Jia-bin Huang 博士导师)。这篇工作为作者在博一期间完成。

研究背景

在三维重建、NeRF 训练、视频生成等任务中,相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法(如 COLMAP)在静态场景下表现优异,但在存在人车运动、物体遮挡的动态场景中往往力不从心,并且依赖额外的运动掩码、深度或点云信息,使用门槛较高,而且效率低下。

纵使在 3R 时代下,三维与四维前馈模型可以高效产出相机相对位姿与点云结构,但 3R 模型本质上仍存在很多痛点。3R 模型对部署硬件容量需求大 (大 GPU), 对丰富高精度训练数据需求大,易发生场景漂移。而且目前基于 3R 模型的衍生品们仍无法做到同时解决这些问题。Per-scene optimization 的方法常常依赖多种监督和先验,同时优化效率低下。

这让作者重新思考:有没有一种方法可以从动态场景视频准确、高效、稳定地预测相机参数,不受前景运动物体的影响,且仅用一段 RGB 视频作为监督呢?

方法概览

为了实现这一目的,他们提出了ROS-Cam(RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes),已被 NeurIPS 2025 接收为 Spotlight 论文。代码即将开源。

百姓社区更多>>

一场81-60,全运会男篮首枚奖牌诞生,辽宁第四,四川登上领奖台 高校保洁阿姨手搓银杏叶周边,校园秋景美出圈! 再破纪录!全运会男子200自:张展硕夺金,潘展乐摘铜,孙杨犯规 微信视频通话藏3个“神仙功能”!90%的人都没用过,实用到哭 离婚证背面竟印着“囍”字?网友炸锅:这是祝福还是讽刺? 五菱之光 EV 电动房车现身工信部,外观内饰证件照公布 当双十一娱乐营销开始降级,淘宝京东们该往哪砸钱? 特斯拉准备扩建工厂,拟年产1000万台人形机器人!高手怎么看? 谷歌前 CEO 施密特:大多数国家最终可能使用中国的 AI 模型 “AI才女”罗福莉发文宣布加入小米 国地中心首席科学家:人形机器人未来收入主要是这两方面 1499元还带全向避障,大疆是真想把这台无人机卖给你 大众与众08申报图,造型看不懂,但是和小鹏合作 数智领航,5G筑梦——南昌移动以新质生产力绘就英雄城转型新图景 Viwoods推出AiPaper Reader电纸书,6.13英寸墨水屏配AI阅读助理 5G-A携手AI激活低空经济动能 新能源车销量首超燃油车!10月渗透率51.6%! 太炸裂!张子宇首秀13中11砍26+3,山东28分大胜轻松开门红! 全运会大乌龙:笑死了徐海东提前倒地庆祝,转头被叫回来继续比赛 18岁小将掀翻奥运冠军,孙杨潘展乐后浪来了! 奶皮子价格每日变动,从7元涨至40元引发市场热议 13.6亿起拍零报名:“最丑建筑”广州圆大厦的三次流拍困局 2026年起,广州新房全都要“拼”出来?你敢住吗 地表最难!全运会乒乓球比赛:世界冠军的内卷修罗场 孙颖莎:全运会是“地表最难”的乒乓球赛场,每一场都要全力以赴 Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力 别再被误导!AI真的会取代人类工作吗?答案让你大跌眼镜! 杭州 “六小龙” 首聚乌镇 周国辉:乌镇峰会见证中国科创 “有效” 发声 一边喊“玩不下去” 一边吃野猪流油 荒野求生戳中多少人的现实困境 网友吐槽高铁票买到19排但车厢只有17排