論文の概要: Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation
- arxiv url: http://arxiv.org/abs/2512.16913v1
- Date: Thu, 18 Dec 2025 18:59:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.253227
- Title: Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation
- Title(参考訳): パノラマの深さ:パノラマの深さ推定のための基礎モデル
- Authors: Xin Lin, Meixi Song, Dizhe Zhang, Wenxuan Lu, Haodong Li, Bo Du, Ming-Hsuan Yang, Truong Nguyen, Lu Qi,
- Abstract要約: パノラマ距離深度基礎モデルを提案する。
我々は、公開データセット、UE5シミュレーターとテキスト・ツー・イメージ・モデルからの高品質な合成データ、Webからの実際のパノラマ画像を組み合わせることで、大規模なデータセットを収集します。
- 参考スコア(独自算出の注目度): 68.95366581365829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present a panoramic metric depth foundation model that generalizes across diverse scene distances. We explore a data-in-the-loop paradigm from the view of both data construction and framework design. We collect a large-scale dataset by combining public datasets, high-quality synthetic data from our UE5 simulator and text-to-image models, and real panoramic images from the web. To reduce domain gaps between indoor/outdoor and synthetic/real data, we introduce a three-stage pseudo-label curation pipeline to generate reliable ground truth for unlabeled images. For the model, we adopt DINOv3-Large as the backbone for its strong pre-trained generalization, and introduce a plug-and-play range mask head, sharpness-centric optimization, and geometry-centric optimization to improve robustness to varying distances and enforce geometric consistency across views. Experiments on multiple benchmarks (e.g., Stanford2D3D, Matterport3D, and Deep360) demonstrate strong performance and zero-shot generalization, with particularly robust and stable metric predictions in diverse real-world scenes. The project page can be found at: \href{https://insta360-research-team.github.io/DAP_website/} {https://insta360-research-team.github.io/DAP\_website/}
- Abstract(参考訳): 本研究では,様々なシーン距離をまたいで一般化するパノラマ距離深度基礎モデルを提案する。
データ構築とフレームワーク設計の両方の観点から、データ・イン・ザ・ループのパラダイムについて検討する。
我々は、公開データセット、UE5シミュレーターとテキスト・ツー・イメージ・モデルからの高品質な合成データ、Webからの実際のパノラマ画像を組み合わせることで、大規模なデータセットを収集します。
室内・屋外・合成・現実データ間の領域ギャップを低減するため、3段階の擬似ラベルキュレーションパイプラインを導入し、未ラベル画像に対する信頼性の高い地上真実を生成する。
このモデルでは、DINOv3-Largeを強力な事前学習一般化のバックボーンとして採用し、プラグアンドプレイレンジマスクヘッド、シャープネス中心の最適化、幾何中心の最適化を導入し、様々な距離に対するロバストネスを改善し、ビュー間の幾何整合性を実現する。
複数のベンチマーク(例えば、Stanford2D3D、Matterport3D、Deep360)の実験では、様々な現実世界のシーンにおいて、特に堅牢で安定したメートル法予測によって、強いパフォーマンスとゼロショットの一般化が示されている。
プロジェクトページは以下の通りである。 \href{https://insta360-research-team.github.io/DAP_website/} {https://insta360-research-team.github.io/DAP\_website/}
関連論文リスト
- TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - PacGDC: Label-Efficient Generalizable Depth Completion with Projection Ambiguity and Consistency [63.74016242995453]
PacGDCは、一般化可能な深度補完のための最小限のアノテーションでデータ多様性を向上させるラベル効率のよい手法である。
本稿では,複数の深度基礎モデルをスケールマニピュレータとして利用する新しいデータ合成パイプラインを提案する。
実験により、PacGDCは複数のベンチマークで顕著に一般化可能であることが示された。
論文 参考訳(メタデータ) (2025-07-10T01:56:30Z) - E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。
GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。
我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。
すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文 参考訳(メタデータ) (2025-06-02T17:53:09Z) - Multi-View Projection for Unsupervised Domain Adaptation in 3D Semantic Segmentation [0.9345376836714131]
教師なしドメイン適応(UDA)のための多視点プロジェクションフレームワークを提案する。
我々の手法はLiDARスキャンをコヒーレントな3Dシーンに整列し、複数の仮想カメラのポーズからレンダリングして2Dデータセット(PC2D)を生成する。
2Dセグメンテーションモデルのアンサンブルは、これらのモダリティに基づいて訓練され、推論中は、1シーンあたり数百ビューが処理され、ロジットは3Dにバックプロジェクションされる。
我々のフレームワークはレアクラスのセグメンテーションを可能にし、それらのクラスに対する2Dアノテーションのみを活用しながら、ソースドメイン内の他のクラスに対する3Dアノテーションに依存していることを示す。
論文 参考訳(メタデータ) (2025-05-21T14:08:42Z) - Calibrating Panoramic Depth Estimation for Practical Localization and
Mapping [20.621442016969976]
周囲環境の絶対深度値は, 局所化, ナビゲーション, 3次元構造推定など, 様々な補助技術にとって重要な手がかりとなる。
本研究では,パノラマ画像から推定される精度の高い深度が,3次元情報を必要とする幅広い下流タスクに対して,強力で軽量な入力として機能することを提案する。
論文 参考訳(メタデータ) (2023-08-27T04:50:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。