Fugu-MT 論文翻訳(概要): From None to All: Self-Supervised 3D Reconstruction via Novel View Synthesis

論文の概要: From None to All: Self-Supervised 3D Reconstruction via Novel View Synthesis

arxiv url: http://arxiv.org/abs/2603.27455v1
Date: Sun, 29 Mar 2026 00:28:38 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:44.967844
Title: From None to All: Self-Supervised 3D Reconstruction via Novel View Synthesis
Title（参考訳）: 11月から11月:新しいビュー合成による自己監督型3D再構成
Authors: Ranran Huang, Weixun Luo, Ye Mao, Krystian Mikolajczyk,
Abstract要約: NAS3Rは、明示的な3次元幾何学とカメラパラメータを共同で学習するセルフ教師付きフィードフォワードフレームワークである。訓練中、NAS3Rは3Dガウシアンを非校正的かつ未設定の文脈ビューから再構築した。 NAS3Rは、自己予測カメラパラメータを使用してターゲットビューをレンダリングし、2D測光監視から自己教師付きトレーニングを可能にする。
参考スコア（独自算出の注目度）: 18.24499102151468
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we introduce NAS3R, a self-supervised feed-forward framework that jointly learns explicit 3D geometry and camera parameters with no ground-truth annotations and no pretrained priors. During training, NAS3R reconstructs 3D Gaussians from uncalibrated and unposed context views and renders target views using its self-predicted camera parameters, enabling self-supervised training from 2D photometric supervision. To ensure stable convergence, NAS3R integrates reconstruction and camera prediction within a shared transformer backbone regulated by masked attention, and adopts a depth-based Gaussian formulation that facilitates well-conditioned optimization. The framework is compatible with state-of-the-art supervised 3D reconstruction architectures and can incorporate pretrained priors or intrinsic information when available. Extensive experiments show that NAS3R achieves superior results to other self-supervised methods, establishing a scalable and geometry-aware paradigm for 3D reconstruction from unconstrained data. Code and models are publicly available at https://ranrhuang.github.io/nas3r/.
Abstract（参考訳）: 本稿では,3次元形状とカメラパラメータを接地アノテーションなしで学習し,事前学習を行わない自己教師型フィードフォワードフレームワークであるNAS3Rを紹介する。トレーニング中、NAS3Rは、3Dガウシアンを、未分類で未提示のコンテキストビューから再構築し、自己予測カメラパラメータを使用してターゲットビューをレンダリングし、2D測光監視による自己監督的なトレーニングを可能にする。安定した収束を確保するため、NAS3Rはマスキングアテンションによって規制された共有トランスフォーマーバックボーン内に再構成とカメラ予測を統合し、よく条件付けられた最適化を容易にする奥行きに基づくガウスの定式化を採用する。このフレームワークは最先端の3D再構築アーキテクチャと互換性があり、利用可能な事前訓練や本質的な情報を組み込むことができる。大規模な実験により,NAS3Rは他の自己管理手法よりも優れた結果が得られ,制約のないデータから3次元再構成を行うためのスケーラブルで幾何学的なパラダイムが確立された。コードとモデルはhttps://ranrhuang.github.io/nas3r/で公開されている。

論文の概要: From None to All: Self-Supervised 3D Reconstruction via Novel View Synthesis

関連論文リスト