論文の概要: PanoVGGT: Feed-Forward 3D Reconstruction from Panoramic Imagery
- arxiv url: http://arxiv.org/abs/2603.17571v1
- Date: Wed, 18 Mar 2026 10:24:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.643757
- Title: PanoVGGT: Feed-Forward 3D Reconstruction from Panoramic Imagery
- Title(参考訳): PanoVGGT:パノラマ画像からのフィードフォワード3次元再構成
- Authors: Yijing Guo, Mengjun Chao, Luo Wang, Tianyang Zhao, Haizhao Dai, Yingliang Zhang, Jingyi Yu, Yujiao Shi,
- Abstract要約: PanoVGGTは、1つの前方パスで1つまたは複数のパノラマからカメラのポーズ、深度マップ、および3Dポイントの雲を共同で予測する。
さらに,深度と6-DoFのポーズアノテーションを備えた大規模屋外パノラマデータセットであるPanoCityをコントリビュートした。
- 参考スコア(独自算出の注目度): 41.23812453847979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panoramic imagery offers a full 360° field of view and is increasingly common in consumer devices. However, it introduces non-pinhole distortions that challenge joint pose estimation and 3D reconstruction. Existing feed-forward models, built for perspective cameras, generalize poorly to this setting. We propose PanoVGGT, a permutation-equivariant Transformer framework that jointly predicts camera poses, depth maps, and 3D point clouds from one or multiple panoramas in a single forward pass. The model incorporates spherical-aware positional embeddings and a panorama-specific three-axis SO(3) rotation augmentation, enabling effective geometric reasoning in the spherical domain. To resolve inherent global-frame ambiguity, we further introduce a stochastic anchoring strategy during training. In addition, we contribute PanoCity, a large-scale outdoor panoramic dataset with dense depth and 6-DoF pose annotations. Extensive experiments on PanoCity and standard benchmarks demonstrate that PanoVGGT achieves competitive accuracy, strong robustness, and improved cross-domain generalization. Code and dataset will be released.
- Abstract(参考訳): パノラマ画像は360度視野を提供しており、消費者デバイスではますます一般的になっている。
しかし、関節ポーズ推定と3次元再構成に挑戦する非ピンホール歪みを導入する。
既存のフィードフォワードモデルは、視界カメラ用に構築されており、この設定をうまく一般化していない。
パノVGT(PanoVGT)は、1つの前方パスで1つまたは複数のパノラマからカメラポーズ、深度マップ、および3D点雲を共同で予測する変圧器フレームワークである。
このモデルは球面を意識した位置埋め込みとパノラマ特異的な3軸SO(3)回転増強を取り入れ、球面領域における効果的な幾何学的推論を可能にする。
固有なグローバルフレームの曖昧さを解決するために,トレーニング中に確率的アンカー戦略を導入する。
さらに,深度と6-DoFのポーズアノテーションを備えた大規模屋外パノラマデータセットであるPanoCityをコントリビュートした。
パノシティと標準ベンチマークに関する大規模な実験は、パノVGTが競争精度、強靭性、クロスドメインの一般化の改善を達成することを示した。
コードとデータセットがリリースされる。
関連論文リスト
- Pano360: Perspective to Panoramic Vision with Geometric Consistency [7.713672589538202]
我々は新しいトランスフォーマーベースのアーキテクチャを採用し、すべての視点で3D認識とグローバル情報を集約する。
評価ベンチマークを確立し,ネットワークをトレーニングするために,実世界のシーンの大規模データセットを構築した。
論文 参考訳(メタデータ) (2026-03-12T14:56:14Z) - Spherical-GOF: Geometry-Aware Panoramic Gaussian Opacity Fields for 3D Scene Reconstruction [17.20174890101058]
Spherical-GOF(Spherical-GOF)は、ガウスのOpacity Fields(GOF)上に構築された一方向レンダリングフレームワークである。
GOFは球面上の単位球面に直接GOF線サンプリングを行い、パノラマ描画のための一貫した光-ガウス相互作用を可能にする。
標準的なパノラマベンチマークの実験は、競争力のある測光品質を示し、一貫性を大幅に改善した。
論文 参考訳(メタデータ) (2026-03-09T15:35:56Z) - CylinderSplat: 3D Gaussian Splatting with Cylindrical Triplanes for Panoramic Novel View Synthesis [53.231427733457224]
CylinderSplatはパノラマ3DGSのフィードフォワードフレームワークである。
シングルビューおよびマルチビューパノラマノビュー合成において、最先端の結果を達成する。
論文 参考訳(メタデータ) (2026-03-06T04:04:20Z) - You Need a Transition Plane: Bridging Continuous Panoramic 3D Reconstruction with Perspective Gaussian Splatting [57.44295803750027]
本稿では,連続的なパノラマ3次元シーンをガウススプラッティングで橋渡しするための新しいフレームワークTPGSを提案する。
具体的には、個々の立方体面内で3Dガウスを最適化し、縫合されたパノラマ空間でそれらを微調整する。
屋内、屋外、エゴセントリック、ローミングのベンチマークデータセットの実験は、我々のアプローチが既存の最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2025-04-12T03:42:50Z) - Splatter-360: Generalizable 360$^{\circ}$ Gaussian Splatting for Wide-baseline Panoramic Images [52.48351378615057]
textitSplatter-360は、ワイドベースラインパノラマ画像を扱うための、エンドツーエンドの汎用3DGSフレームワークである。
パノラマ画像に固有の歪みを緩和する3D対応複投影エンコーダを提案する。
これにより、堅牢な3D対応機能表現とリアルタイムレンダリングが可能になる。
論文 参考訳(メタデータ) (2024-12-09T06:58:31Z) - DiffPano: Scalable and Consistent Text to Panorama Generation with Spherical Epipolar-Aware Diffusion [60.45000652592418]
本稿では,テキスト駆動型パノラマ生成フレームワークDiffPanoを提案し,拡張性,一貫性,多様なパノラマシーン生成を実現する。
DiffPanoは、不明瞭なテキスト記述とカメラのポーズによって、一貫した多様なパノラマ画像を生成することができることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:57:02Z) - PanoGRF: Generalizable Spherical Radiance Fields for Wide-baseline
Panoramas [54.4948540627471]
広帯域パノラマのための一般化可能な球面放射場パノGRFを提案する。
パノGRFは、視線画像に基づいて訓練された一般化可能な放射場とは異なり、パノラマからパースペクティブへの変換から情報損失を回避する。
複数のパノラマデータセットの結果は、パノGRFが最先端の一般化可能なビュー合成法よりも著しく優れていることを示している。
論文 参考訳(メタデータ) (2023-06-02T13:35:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。