論文の概要: Detailed Geometry and Appearance from Opportunistic Motion
- arxiv url: http://arxiv.org/abs/2603.26665v1
- Date: Fri, 27 Mar 2026 17:59:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.637842
- Title: Detailed Geometry and Appearance from Opportunistic Motion
- Title(参考訳): オポチュニスト運動の詳細な形状と外観
- Authors: Ryosuke Hirai, Kohei Yamashita, Antoine Guédon, Ryo Kawahara, Vincent Lepetit, Ko Nishino,
- Abstract要約: 固定カメラの粗い集合から3次元形状と外観を再構築することは、幅広い用途において基礎的な課題である。
静止カメラは局所座標フレーム内の物体の軌道を効果的に公転し、仮想的な視点を提供する。
しかし、この物体の動きを調和させることは、物体のポーズの密結合と幾何学的推定と、静的照明下で動く物体の複雑な外観変化の2つの課題をもたらす。
- 参考スコア(独自算出の注目度): 44.38825288921379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing 3D geometry and appearance from a sparse set of fixed cameras is a foundational task with broad applications, yet it remains fundamentally constrained by the limited viewpoints. We show that this bound can be broken by exploiting opportunistic object motion: as a person manipulates an object~(e.g., moving a chair or lifting a mug), the static cameras effectively ``orbit'' the object in its local coordinate frame, providing additional virtual viewpoints. Harnessing this object motion, however, poses two challenges: the tight coupling of object pose and geometry estimation and the complex appearance variations of a moving object under static illumination. We address these by formulating a joint pose and shape optimization using 2D Gaussian splatting with alternating minimization of 6DoF trajectories and primitive parameters, and by introducing a novel appearance model that factorizes diffuse and specular components with reflected directional probing within the spherical harmonics space. Extensive experiments on synthetic and real-world datasets with extremely sparse viewpoints demonstrate that our method recovers significantly more accurate geometry and appearance than state-of-the-art baselines.
- Abstract(参考訳): 固定カメラの粗い集合から3次元形状と外観を再構成することは、幅広い用途において基礎的な課題であるが、制限された視点で基本的に制限されている。
物体~(例えば、椅子を動かしたり、マグカップを持ち上げたりする)を操作すると、静的カメラはその局所座標フレーム内の物体の「軌道」を効果的に制御し、仮想的な視点を提供する。
しかし、この物体の動きを調和させることは、物体のポーズの密結合と幾何学的推定と、静的照明下で動く物体の複雑な外観変化の2つの課題をもたらす。
本研究では, 6DoF軌道と原始パラメータを交互に最小化した2次元ガウススプラッティングを用いて, 関節ポーズと形状最適化を定式化し, 球面高調波空間内での反射方向プローブによる拡散成分とスペクトル成分を分解する新しい外観モデルを導入する。
極めてスパースな視点を持つ合成および実世界のデータセットに対する大規模な実験により、我々の手法は最先端のベースラインよりもはるかに正確な幾何と外観を復元することを示した。
関連論文リスト
- Articulat3D: Reconstructing Articulated Digital Twins From Monocular Videos with Geometric and Motion Constraints [21.83046776294786]
Articulat3Dは、カジュアルにキャプチャされたモノクロビデオからデジタルツインを構築する新しいフレームワークである。
まず,3次元の軌跡を利用して調音運動の低次元構造を利用する動き優先初期化を提案する。
次に、物理的に可算な調音を強制する幾何学的・運動的制約(Geometric and Motion Constraints Refinement)を導入する。
実験により、Articulat3Dは、合成ベンチマークと現実世界のカジュアルにキャプチャされたモノクロビデオで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-03-12T06:59:44Z) - PAOLI: Pose-free Articulated Object Learning from Sparse-view Images [27.16160315662701]
本稿では,スパースビュー,アンポーズ画像から明瞭なオブジェクト表現を学習するための新しいフレームワークを提案する。
当社のアプローチは1音節あたり4ビューで運用されており、カメラの監視は行いません。
論文 参考訳(メタデータ) (2025-09-04T14:51:03Z) - GaussianArt: Unified Modeling of Geometry and Motion for Articulated Objects [4.717906057951389]
本稿では,3次元ガウスモデルを用いて幾何学と運動を共同でモデル化する統一表現を提案する。
この定式化により、運動分解の堅牢性が向上し、最大で20個の部分を持つ明瞭な物体をサポートする。
提案手法は, 広範囲な物体の形状復元と動き推定において, 常に優れた精度を達成できることを示す。
論文 参考訳(メタデータ) (2025-08-20T17:59:08Z) - Part$^{2}$GS: Part-aware Modeling of Articulated Objects using 3D Gaussian Splatting [9.432567695900184]
Part$2$GSは、高忠実度幾何を持つ多部オブジェクトの調音されたデジタルツインをモデル化するための新しいフレームワークである。
物理的に一貫した運動を保証するために,物理に基づく制約によって導かれる運動認識の標準表現を提案する。
Part$2$GSは、可動部品に対するChamfer Distanceにおいて、最先端のメソッドを最大10$times$で一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-06-20T17:59:12Z) - Dynamic Scene Understanding through Object-Centric Voxelization and Neural Rendering [57.895846642868904]
オブジェクト中心学習が可能な動的シーンのための3次元生成モデルDynaVol-Sを提案する。
ボキセル化は、個々の空間的位置において、物体ごとの占有確率を推定する。
提案手法は2次元セマンティックな特徴を統合して3次元セマンティック・グリッドを作成し,複数の不整合ボクセル・グリッドを通してシーンを表現する。
論文 参考訳(メタデータ) (2024-07-30T15:33:58Z) - Decaf: Monocular Deformation Capture for Face and Hand Interactions [77.75726740605748]
本稿では,単眼のRGBビデオから人間の顔と対話する人間の手を3Dで追跡する手法を提案する。
動作中の非剛性面の変形を誘発する定形物体として手をモデル化する。
本手法は,マーカーレスマルチビューカメラシステムで取得した現実的な顔変形を伴う手動・インタラクションキャプチャーデータセットに頼っている。
論文 参考訳(メタデータ) (2023-09-28T17:59:51Z) - Towards Scalable Multi-View Reconstruction of Geometry and Materials [27.660389147094715]
本稿では,3次元シーンのカメラポーズ,オブジェクト形状,空間変化の両方向反射分布関数(svBRDF)のジョイントリカバリ手法を提案する。
入力は高解像度のRGBD画像であり、アクティブ照明用の点灯付き携帯型ハンドヘルドキャプチャシステムによってキャプチャされる。
論文 参考訳(メタデータ) (2023-06-06T15:07:39Z) - Object Wake-up: 3-D Object Reconstruction, Animation, and in-situ
Rendering from a Single Image [58.69732754597448]
椅子の写真があれば、椅子の3次元形状を抽出し、その可愛らしい調音や動きをアニメーション化し、元の画像空間でその場でレンダリングできるだろうか?
単一画像中の調音対象を抽出・操作するための自動アプローチを考案する。
論文 参考訳(メタデータ) (2021-08-05T16:20:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。