Fugu-MT 論文翻訳(概要): MOSIV: Multi-Object System Identification from Videos

論文の概要: MOSIV: Multi-Object System Identification from Videos

arxiv url: http://arxiv.org/abs/2603.06022v1
Date: Fri, 06 Mar 2026 08:16:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-09 13:17:45.369965
Title: MOSIV: Multi-Object System Identification from Videos
Title（参考訳）: MOSIV:ビデオからのマルチオブジェクトシステム同定
Authors: Chunjiang Liu, Xiaoyuan Wang, Qingran Lin, Albert Xiao, Haoyu Chen, Shizheng Wen, Hao Zhang, Lu Qi, Ming-Hsuan Yang, Laszlo A. Jeni, Min Xu, Yizhou Zhao,
Abstract要約: 本稿では,映像から導出される幾何学的目的によって導かれる微分可能シミュレータを用いて,連続的かつ対象ごとの材料パラメータを直接最適化するフレームワークを提案する。また,接触に富んだ多目的インタラクションを用いた新しい総合的ベンチマークを提案し,評価を容易にする。
参考スコア（独自算出の注目度）: 54.53609234233857
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce the challenging problem of multi-object system identification from videos, for which prior methods are ill-suited due to their focus on single-object scenes or discrete material classification with a fixed set of material prototypes. To address this, we propose MOSIV, a new framework that directly optimizes for continuous, per-object material parameters using a differentiable simulator guided by geometric objectives derived from video. We also present a new synthetic benchmark with contact-rich, multi-object interactions to facilitate evaluation. On this benchmark, MOSIV substantially improves grounding accuracy and long-horizon simulation fidelity over adapted baselines, establishing it as a strong baseline for this new task. Our analysis shows that object-level fine-grained supervision and geometry-aligned objectives are critical for stable optimization in these complex, multi-object settings. The source code and dataset will be released.
Abstract（参考訳）: 本稿では,ビデオからの多目的システム識別の課題について紹介する。これは,単一対象シーンに焦点をあてる従来の手法が不適当である場合や,固定された素材のプロトタイプによる個別の素材分類が不適当である場合である。そこで本研究では,映像から導出される幾何学的目的によって導かれる微分可能シミュレータを用いて,オブジェクトごとの連続的パラメータを直接最適化する新しいフレームワーク MOSIV を提案する。また,接触に富んだ多目的インタラクションを用いた新しい総合的ベンチマークを提案し,評価を容易にする。このベンチマークでは、MOSIVは適応ベースラインよりもグラウンド化精度と長期水平シミュレーション忠実度を大幅に改善し、この新しいタスクの強力なベースラインとして確立する。これらの複雑な多目的設定において、オブジェクトレベルのきめ細かい監督と幾何に整合した目的が安定した最適化に不可欠であることを示す。ソースコードとデータセットがリリースされる。

論文の概要: MOSIV: Multi-Object System Identification from Videos

関連論文リスト