論文の概要: JRM: Joint Reconstruction Model for Multiple Objects without Alignment
- arxiv url: http://arxiv.org/abs/2603.25985v1
- Date: Fri, 27 Mar 2026 00:15:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.317982
- Title: JRM: Joint Reconstruction Model for Multiple Objects without Alignment
- Title(参考訳): JRM:アライメントのない複数物体の関節再建モデル
- Authors: Qirui Wu, Yawar Siddiqui, Duncan Frost, Samir Aroudj, Armen Avetisyan, Richard Newcombe, Angel X. Chang, Jakob Engel, Henry Howard-Jenkins,
- Abstract要約: オブジェクト中心の再構成は、独立したオブジェクトの合成によってシーンの3次元構造を復元しようとする。
本研究では, フレーミングオブジェクト再構成による反復をパーソナライズされた世代の一つとして活用する統合再構成モデル(JRM)を提案する。
JRMは3次元フローマッチング生成モデルであり、その潜在空間における無秩序な観測を暗黙的に集約する。
- 参考スコア(独自算出の注目度): 18.700935077095956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object-centric reconstruction seeks to recover the 3D structure of a scene through composition of independent objects. While this independence can simplify modeling, it discards strong signals that could improve reconstruction, notably repetition where the same object model is seen multiple times in a scene, or across scans. We propose the Joint Reconstruction Model (JRM) to leverage repetition by framing object reconstruction as one of personalized generation: multiple observations share a common subject that should be consistent for all observations, while still adhering to the specific pose and state from each. Prior methods in this direction rely on explicit matching and rigid alignment across observations, making them sensitive to errors and difficult to extend to non-rigid transformations. In contrast, JRM is a 3D flow-matching generative model that implicitly aggregates unaligned observations in its latent space, learning to produce consistent and faithful reconstructions in a data-driven manner without explicit constraints. Evaluations on synthetic and real-world data show that JRM's implicit aggregation removes the need for explicit alignment, improves robustness to incorrect associations, and naturally handles non-rigid changes such as articulation. Overall, JRM outperforms both independent and alignment-based baselines in reconstruction quality.
- Abstract(参考訳): オブジェクト中心の再構成は、独立したオブジェクトの合成によってシーンの3次元構造を復元しようとする。
この独立性はモデリングを単純化するが、再構成を改善する強力な信号を捨てる。
本稿では,複数の観測対象が共通の対象を共有しながら,各観測対象の特定のポーズや状態に固執し,各観測対象に整合性を持たせることを目的として,フレーミングオブジェクト再構成による反復の活用を個人化生成の1つとして提案する。
この方向の以前の手法は、観測を横断する明示的なマッチングと厳密なアライメントに依存しており、エラーに敏感であり、非剛体変換への拡張が困難である。
対照的に、JRMは3次元フローマッチング生成モデルであり、その潜在空間における不整合観測を暗黙的に集約し、明示的な制約を伴わずにデータ駆動型で一貫した忠実な再構築を学習する。
合成および実世界のデータから、JRMの暗黙の集約は、明示的なアライメントの必要性を排除し、不正確な関連性に対する堅牢性を改善し、調音などの非厳密な変化を自然に処理することを示す。
総じて、JRMは、独立したベースラインとアライメントベースのベースラインの両方において、再構築品質に優れています。
関連論文リスト
- Scene Grounding In the Wild [27.597534811067348]
大規模な現実世界のシーンの正確な3Dモデルを、非構造的で、その中の画像から再構築することは、コンピュータビジョンにおける重要な課題である。
シーンの完全な参照モデルに各部分再構成を基礎とするフレームワークを提案する。
従来のパイプラインや学習ベースのパイプラインでは,我々のアプローチが一貫してグローバルアライメントを改善することを示す。
論文 参考訳(メタデータ) (2026-03-27T16:41:20Z) - Long-Term Multi-Session 3D Reconstruction Under Substantial Appearance Change [52.46888249268445]
長期の環境モニタリングには、数ヶ月または数年ごとに分割された繰り返しサイト訪問で3Dモデルを再構築し調整する機能が必要である。
既存のアプローチは、独立して再構築されたセッションのポストホックアライメントに依存している。
我々は,共同SfM再建において,クロスセッション対応を直接実施することを提案する。
論文 参考訳(メタデータ) (2026-02-24T06:12:51Z) - IDSplat: Instance-Decomposed 3D Gaussian Splatting for Driving Scenes [25.939318593012484]
動的駆動シーンの再構築は、センサ・リアリスティック・シミュレーションによる自律システム開発に不可欠である。
我々は,動的シーンを明示的なインスタンス分解と学習可能なモーショントラジェクトリで再構成する,自己教師型3次元ガウススティングフレームワークIDSplatを提案する。
本手法は, インスタンスレベルの分解を維持しつつ, 競合する再構成品質を実現し, 再トレーニングを伴わずに, 多様なシーケンスやビュー密度を一般化する。
論文 参考訳(メタデータ) (2025-11-24T15:48:08Z) - CoordAR: One-Reference 6D Pose Estimation of Novel Objects via Autoregressive Coordinate Map Generation [20.453498343557026]
CoordARは、一参照6Dポーズ推定のための新しい自動回帰フレームワークである。
1) 離散化された3次元空間上での確率的予測を可能にする新しい座標マップのトークン化,2) RGBの外観と座標キューを別々に符号化するモダリティデカップリング符号化戦略,3) 両方の位置整列クエリ特徴に条件付き自己回帰変換器デコーダを提案する。
論文 参考訳(メタデータ) (2025-11-17T03:15:46Z) - KineDiff3D: Kinematic-Aware Diffusion for Category-Level Articulated Object Shape Reconstruction and Generation [28.822034731724013]
ノートパソコンや引き出しなどのアーティキュレートオブジェクトは、3D再構成とポーズ推定において重要な課題を示す。
そこで我々は, KineDiff3D: Kinematic-Aware Diffusion for Category-Level Articulated Object Shape Reconstruction and Generationを提案する。
論文 参考訳(メタデータ) (2025-10-20T04:15:40Z) - Are Any-to-Any Models More Consistent Across Modality Transfers Than Specialists? [14.044169097789034]
ACONは、字幕、編集命令、Q&Aペアと組み合わせた1000枚の画像からなるデータセットで、モーダル間転送を評価する。
実験の結果,任意のモデルが,ポイントワイド評価において,特定のモデルよりも一貫した相互整合性を示さないことが明らかとなった。
論文 参考訳(メタデータ) (2025-05-30T04:51:54Z) - Detection Based Part-level Articulated Object Reconstruction from Single RGBD Image [52.11275397911693]
本稿では,1枚のRGBD画像から複数の人工関節オブジェクトを再構成する,エンドツーエンドで訓練可能なクロスカテゴリ手法を提案する。
私たちは、あらかじめ定義された部分数で人工的なオブジェクトに焦点をあて、インスタンスレベルの潜在空間を学習することに依存する以前の作業から離れています。
提案手法は, 従来の作業では処理できない様々な構成された複数インスタンスの再構築に成功し, 形状再構成や運動学推定において, 先行の作業よりも優れていた。
論文 参考訳(メタデータ) (2025-04-04T05:08:04Z) - Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.43562856605473]
複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。
本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文 参考訳(メタデータ) (2024-05-27T15:47:03Z) - TSDF++: A Multi-Object Formulation for Dynamic Object Tracking and
Reconstruction [57.1209039399599]
我々は,シーン全体とその中のすべてのオブジェクトに対して,単一のボリュームを維持できるマップ表現を提案する。
複数の動的オブジェクト追跡および再構成シナリオにおいて,本表現は,近接して移動する他のオブジェクトによって一時的にオクルードされても,表面の正確な再構成を維持できる。
提案したTSDF++の定式化を公開合成データセット上で評価し,標準のTSDFマップ表現と比較した場合の閉塞面の復元性を示す。
論文 参考訳(メタデータ) (2021-05-16T16:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。