論文の概要: MOSIV: Multi-Object System Identification from Videos
- arxiv url: http://arxiv.org/abs/2603.06022v1
- Date: Fri, 06 Mar 2026 08:16:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.369965
- Title: MOSIV: Multi-Object System Identification from Videos
- Title(参考訳): MOSIV:ビデオからのマルチオブジェクトシステム同定
- Authors: Chunjiang Liu, Xiaoyuan Wang, Qingran Lin, Albert Xiao, Haoyu Chen, Shizheng Wen, Hao Zhang, Lu Qi, Ming-Hsuan Yang, Laszlo A. Jeni, Min Xu, Yizhou Zhao,
- Abstract要約: 本稿では,映像から導出される幾何学的目的によって導かれる微分可能シミュレータを用いて,連続的かつ対象ごとの材料パラメータを直接最適化するフレームワークを提案する。
また,接触に富んだ多目的インタラクションを用いた新しい総合的ベンチマークを提案し,評価を容易にする。
- 参考スコア(独自算出の注目度): 54.53609234233857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the challenging problem of multi-object system identification from videos, for which prior methods are ill-suited due to their focus on single-object scenes or discrete material classification with a fixed set of material prototypes. To address this, we propose MOSIV, a new framework that directly optimizes for continuous, per-object material parameters using a differentiable simulator guided by geometric objectives derived from video. We also present a new synthetic benchmark with contact-rich, multi-object interactions to facilitate evaluation. On this benchmark, MOSIV substantially improves grounding accuracy and long-horizon simulation fidelity over adapted baselines, establishing it as a strong baseline for this new task. Our analysis shows that object-level fine-grained supervision and geometry-aligned objectives are critical for stable optimization in these complex, multi-object settings. The source code and dataset will be released.
- Abstract(参考訳): 本稿では,ビデオからの多目的システム識別の課題について紹介する。これは,単一対象シーンに焦点をあてる従来の手法が不適当である場合や,固定された素材のプロトタイプによる個別の素材分類が不適当である場合である。
そこで本研究では,映像から導出される幾何学的目的によって導かれる微分可能シミュレータを用いて,オブジェクトごとの連続的パラメータを直接最適化する新しいフレームワーク MOSIV を提案する。
また,接触に富んだ多目的インタラクションを用いた新しい総合的ベンチマークを提案し,評価を容易にする。
このベンチマークでは、MOSIVは適応ベースラインよりもグラウンド化精度と長期水平シミュレーション忠実度を大幅に改善し、この新しいタスクの強力なベースラインとして確立する。
これらの複雑な多目的設定において、オブジェクトレベルのきめ細かい監督と幾何に整合した目的が安定した最適化に不可欠であることを示す。
ソースコードとデータセットがリリースされる。
関連論文リスト
- Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Scalable Video Object Segmentation with Identification Mechanism [125.4229430216776]
本稿では,半教師付きビデオオブジェクト(VOS)のスケーラブルで効果的なマルチオブジェクトモデリングを実現する上での課題について検討する。
AOT(Associating Objects with Transformers)とAOST(Associating Objects with Scalable Transformers)の2つの革新的なアプローチを提案する。
当社のアプローチは最先端の競合に勝って,6つのベンチマークすべてにおいて,例外的な効率性とスケーラビリティを一貫して示しています。
論文 参考訳(メタデータ) (2022-03-22T03:33:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。