論文の概要: From None to All: Self-Supervised 3D Reconstruction via Novel View Synthesis
- arxiv url: http://arxiv.org/abs/2603.27455v1
- Date: Sun, 29 Mar 2026 00:28:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.967844
- Title: From None to All: Self-Supervised 3D Reconstruction via Novel View Synthesis
- Title(参考訳): 11月から11月:新しいビュー合成による自己監督型3D再構成
- Authors: Ranran Huang, Weixun Luo, Ye Mao, Krystian Mikolajczyk,
- Abstract要約: NAS3Rは、明示的な3次元幾何学とカメラパラメータを共同で学習するセルフ教師付きフィードフォワードフレームワークである。
訓練中、NAS3Rは3Dガウシアンを非校正的かつ未設定の文脈ビューから再構築した。
NAS3Rは、自己予測カメラパラメータを使用してターゲットビューをレンダリングし、2D測光監視から自己教師付きトレーニングを可能にする。
- 参考スコア(独自算出の注目度): 18.24499102151468
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce NAS3R, a self-supervised feed-forward framework that jointly learns explicit 3D geometry and camera parameters with no ground-truth annotations and no pretrained priors. During training, NAS3R reconstructs 3D Gaussians from uncalibrated and unposed context views and renders target views using its self-predicted camera parameters, enabling self-supervised training from 2D photometric supervision. To ensure stable convergence, NAS3R integrates reconstruction and camera prediction within a shared transformer backbone regulated by masked attention, and adopts a depth-based Gaussian formulation that facilitates well-conditioned optimization. The framework is compatible with state-of-the-art supervised 3D reconstruction architectures and can incorporate pretrained priors or intrinsic information when available. Extensive experiments show that NAS3R achieves superior results to other self-supervised methods, establishing a scalable and geometry-aware paradigm for 3D reconstruction from unconstrained data. Code and models are publicly available at https://ranrhuang.github.io/nas3r/.
- Abstract(参考訳): 本稿では,3次元形状とカメラパラメータを接地アノテーションなしで学習し,事前学習を行わない自己教師型フィードフォワードフレームワークであるNAS3Rを紹介する。
トレーニング中、NAS3Rは、3Dガウシアンを、未分類で未提示のコンテキストビューから再構築し、自己予測カメラパラメータを使用してターゲットビューをレンダリングし、2D測光監視による自己監督的なトレーニングを可能にする。
安定した収束を確保するため、NAS3Rはマスキングアテンションによって規制された共有トランスフォーマーバックボーン内に再構成とカメラ予測を統合し、よく条件付けられた最適化を容易にする奥行きに基づくガウスの定式化を採用する。
このフレームワークは最先端の3D再構築アーキテクチャと互換性があり、利用可能な事前訓練や本質的な情報を組み込むことができる。
大規模な実験により,NAS3Rは他の自己管理手法よりも優れた結果が得られ,制約のないデータから3次元再構成を行うためのスケーラブルで幾何学的なパラダイムが確立された。
コードとモデルはhttps://ranrhuang.github.io/nas3r/で公開されている。
関連論文リスト
- Selfi: Self Improving Reconstruction Engine via 3D Geometric Feature Alignment [15.822150318879052]
機能アライメントによる自己改善型3D再構築パイプラインであるSelfiを紹介する。
我々は、リジェクションベースの一貫性損失を使用して軽量な機能アダプタを訓練する。
これにより、NVSとカメラのポーズ推定の両方における最先端のパフォーマンスが実現される。
論文 参考訳(メタデータ) (2025-12-09T18:59:52Z) - ACT-R: Adaptive Camera Trajectories for Single View 3D Reconstruction [16.03389355810877]
多視点合成に適応的な視点計画法を導入する。
我々は3次元コヒーレンスを高めるために時間的一貫性を活用して一連のビューを生成する。
論文 参考訳(メタデータ) (2025-05-13T05:31:59Z) - FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [100.45129752375658]
FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文 参考訳(メタデータ) (2025-02-17T18:54:05Z) - FreeSplatter: Pose-free Gaussian Splatting for Sparse-view 3D Reconstruction [69.63414788486578]
FreeSplatterはスケーラブルなフィードフォワードフレームワークで、キャリブレーションされていないスパースビュー画像から高品質な3Dガウシアンを生成する。
当社のアプローチでは,自己注意ブロックが情報交換を容易にする合理化トランスフォーマーアーキテクチャを採用している。
包括的データセットに基づいて,オブジェクト中心とシーンレベルの再構築のための2つの特殊な変種を開発する。
論文 参考訳(メタデータ) (2024-12-12T18:52:53Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。