論文の概要: Free Geometry: Refining 3D Reconstruction from Longer Versions of Itself
- arxiv url: http://arxiv.org/abs/2604.14048v1
- Date: Wed, 15 Apr 2026 16:24:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.635157
- Title: Free Geometry: Refining 3D Reconstruction from Longer Versions of Itself
- Title(参考訳): フリージオメトリ:より長いバージョンから3Dレコンストラクションを仕上げる
- Authors: Yuhang Dai, Xingyi Yang,
- Abstract要約: Free Geometryは、フィードフォワードの3D再構成モデルが3D基底の真理なしにテスト時に自己進化することを可能にするフレームワークである。
当社のアプローチは、4つのベンチマークデータセットにまたがって、Depth Anything 3やVGGTといった最先端の基礎モデルを継続的に改善しています。
- 参考スコア(独自算出の注目度): 38.95274911975506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feed-forward 3D reconstruction models are efficient but rigid: once trained, they perform inference in a zero-shot manner and cannot adapt to the test scene. As a result, visually plausible reconstructions often contain errors, particularly under occlusions, specularities, and ambiguous cues. To address this, we introduce Free Geometry, a framework that enables feed-forward 3D reconstruction models to self-evolve at test time without any 3D ground truth. Our key insight is that, when the model receives more views, it produces more reliable and view-consistent reconstructions. Leveraging this property, given a testing sequence, we mask a subset of frames to construct a self-supervised task. Free Geometry enforces cross-view feature consistency between representations from full and partial observations, while maintaining the pairwise relations implied by the held-out frames. This self-supervision allows for fast recalibration via lightweight LoRA updates, taking less than 2 minutes per dataset on a single GPU. Our approach consistently improves state-of-the-art foundation models, including Depth Anything 3 and VGGT, across 4 benchmark datasets, yielding an average improvement of 3.73% in camera pose accuracy and 2.88% in point map prediction. Code is available at https://github.com/hiteacherIamhumble/Free-Geometry .
- Abstract(参考訳): フィードフォワード3D再構成モデルは効率的だが剛性があり、訓練されるとゼロショットで推論を行い、テストシーンに適応できない。
結果として、視覚的にもっともらしい再建は、特に閉塞、特異性、曖昧な手がかりの下でエラーを含むことが多い。
これを解決するために、我々は、フィードフォワード3次元再構成モデルを3次元基底真理なしにテスト時に自己展開できるフレームワークであるFree Geometryを紹介した。
私たちの重要な洞察は、モデルがより多くのビューを受け取ると、より信頼性が高く、ビューに一貫性のある再構築が得られます。
この特性を活用して、テストシーケンスが与えられたら、フレームのサブセットを隠蔽して自己教師型タスクを構築する。
Free Geometryは、完全な観察から部分的な観察までの表現間の横断的な特徴整合を強制する一方で、保持されたフレームによって暗示されるペアワイズ関係を維持している。
このセルフスーパービジョンは、軽量なLoRAアップデートによる高速なリカバリを可能にし、単一のGPU上でデータセット毎に2分未満で済む。
我々のアプローチは、4つのベンチマークデータセットでDepth Anything 3とVGGTを含む最先端の基礎モデルを継続的に改善し、カメラポーズの精度が3.73%、ポイントマップの予測が2.88%向上した。
コードはhttps://github.com/hiteacherIamhumble/Free-Geometryで入手できる。
関連論文リスト
- RnG: A Unified Transformer for Complete 3D Modeling from Partial Observations [70.83499963694238]
RnG(Reconstruction and Generation)は、再構成と生成を統合する新しいフィードフォワードトランスである。
可視的幾何学を再構築し、可視的でコヒーレントな不明瞭な幾何学と外観を生成する。
提案手法は, 一般化可能な3次元再構成と新しいビュー生成の両方において, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2026-03-01T17:25:32Z) - Test3R: Learning to Reconstruct 3D at Test Time [58.0912500917036]
Test3Rは驚くほどシンプルなテストタイム学習技術で、幾何学的精度を大幅に向上させる。
本手法は従来の3次元再構成法や多視点深度推定法よりも優れていた。
論文 参考訳(メタデータ) (2025-06-16T17:56:22Z) - E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。
GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。
我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。
すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文 参考訳(メタデータ) (2025-06-02T17:53:09Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - FvOR: Robust Joint Shape and Pose Optimization for Few-view Object
Reconstruction [37.81077373162092]
数枚の画像から正確な3Dオブジェクトモデルを再構築することは、コンピュータビジョンにおいて難しい問題である。
FvORは、ノイズの多い入力ポーズを持つ数枚の画像から正確な3Dモデルを予測する学習ベースのオブジェクト再構成手法である。
論文 参考訳(メタデータ) (2022-05-16T15:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。