論文の概要: Pano360: Perspective to Panoramic Vision with Geometric Consistency
- arxiv url: http://arxiv.org/abs/2603.12013v1
- Date: Thu, 12 Mar 2026 14:56:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.15898
- Title: Pano360: Perspective to Panoramic Vision with Geometric Consistency
- Title(参考訳): Pano360: 幾何学的一貫性を備えたパノラマ視
- Authors: Zhengdong Zhu, Weiyi Xue, Zuyuan Yang, Wenlve Zhou, Zhiheng Zhou,
- Abstract要約: 我々は新しいトランスフォーマーベースのアーキテクチャを採用し、すべての視点で3D認識とグローバル情報を集約する。
評価ベンチマークを確立し,ネットワークをトレーニングするために,実世界のシーンの大規模データセットを構築した。
- 参考スコア(独自算出の注目度): 7.713672589538202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prior panorama stitching approaches heavily rely on pairwise feature correspondences and are unable to leverage geometric consistency across multiple views. This leads to severe distortion and misalignment, especially in challenging scenes with weak textures, large parallax, and repetitive patterns. Given that multi-view geometric correspondences can be directly constructed in 3D space, making them more accurate and globally consistent, we extend the 2D alignment task to the 3D photogrammetric space. We adopt a novel transformer-based architecture to achieve 3D awareness and aggregate global information across all views. It directly utilizes camera poses to guide image warping for global alignment in 3D space and employs a multi-feature joint optimization strategy to compute the seams. Additionally, to establish an evaluation benchmark and train our network, we constructed a large-scale dataset of real-world scenes. Extensive experiments show that our method significantly outperforms existing alternatives in alignment accuracy and perceptual quality.
- Abstract(参考訳): 以前のパノラマ縫合アプローチは、ペアワイズな特徴対応に大きく依存しており、複数のビューにまたがる幾何的一貫性を活用できない。
これは、特に弱いテクスチャ、大きなパララックス、反復的なパターンを持つ挑戦的なシーンにおいて、厳しい歪みと不整合をもたらす。
多視点幾何対応は3次元空間で直接構築できるので、より正確で一貫した結果が得られるので、2次元アライメントタスクを3次元フォトグラム空間に拡張する。
我々は新しいトランスフォーマーベースのアーキテクチャを採用し、すべての視点で3D認識とグローバル情報を集約する。
カメラのポーズを直接利用し、3次元空間におけるグローバルアライメントのための画像ワープをガイドし、シームを計算するために多機能共同最適化戦略を採用している。
さらに,評価ベンチマークを確立し,ネットワークをトレーニングするために,実世界のシーンの大規模データセットを構築した。
本手法は,アライメント精度と知覚品質において,既存手法よりも有意に優れていた。
関連論文リスト
- TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - SPIDER: Spatial Image CorresponDence Estimator for Robust Calibration [28.539636818320886]
本稿では,共有特徴抽出バックボーンを2つの専用ネットワークヘッドに統合した共通特徴マッチングフレームワークであるSPIDERを紹介する。
SPIDERはSoTA法よりも優れており、普遍的な画像マッチング法としての強い能力を示している。
論文 参考訳(メタデータ) (2025-11-21T20:02:08Z) - LSS3D: Learnable Spatial Shifting for Consistent and High-Quality 3D Generation from Single-Image [12.683334603689502]
我々は,多視点不整合と非正面入力ビューを扱うために,学習可能な空間シフトを用いた高品質な画像から3次元画像へのアプローチ LSS3D を提案する。
具体的には、各ビューに学習可能な空間シフトパラメータを割り当て、再構成メッシュでガイドされた空間的に一貫したターゲットに対して各ビューを調整する。
提案手法は, よりフレキシブルな入力視点における幾何学的, テクスチャ的評価指標の双方において, 導出結果を一貫して達成する。
論文 参考訳(メタデータ) (2025-11-15T13:14:25Z) - WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting [51.69408870574092]
汎用的な3次元幾何予測タスクのためのオールインワンフィードフォワードモデルであるWorldMirrorを提案する。
我々のフレームワークは、カメラのポーズ、内在性、深度マップなど、様々な幾何学的先入観を柔軟に統合する。
WorldMirrorは、カメラ、ポイントマップ、深さ、表面正規推定から新しいビュー合成に至るまで、さまざまなベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-12T17:59:09Z) - IGFuse: Interactive 3D Gaussian Scene Reconstruction via Multi-Scans Fusion [15.837932667195037]
IGFuseは対話型ガウスシーンを複数のスキャンから観測することで再構成する新しいフレームワークである。
本手法は,ガウス場を意識したセグメンテーションを構築し,スキャン間の双方向光度・セマンティック一貫性を実現する。
IGFuseは、密度の高い観測や複雑なパイプラインを使わずに、高忠実なレンダリングとオブジェクトレベルのシーン操作を可能にする。
論文 参考訳(メタデータ) (2025-08-18T17:59:47Z) - CDI3D: Cross-guided Dense-view Interpolation for 3D Reconstruction [25.468907201804093]
大規模再構成モデル (LRM) は, 2次元拡散モデルにより生成された多視点画像を利用して3次元コンテンツを抽出する際の大きな可能性を示している。
しかし、2次元拡散モデルはしばしば、強い多視点一貫性を持つ高密度画像を生成するのに苦労する。
CDI3Dは,高画質で高画質な3D画像生成を実現するためのフィードフォワードフレームワークである。
論文 参考訳(メタデータ) (2025-03-11T03:08:43Z) - Splatter-360: Generalizable 360$^{\circ}$ Gaussian Splatting for Wide-baseline Panoramic Images [52.48351378615057]
textitSplatter-360は、ワイドベースラインパノラマ画像を扱うための、エンドツーエンドの汎用3DGSフレームワークである。
パノラマ画像に固有の歪みを緩和する3D対応複投影エンコーダを提案する。
これにより、堅牢な3D対応機能表現とリアルタイムレンダリングが可能になる。
論文 参考訳(メタデータ) (2024-12-09T06:58:31Z) - Wonder3D: Single Image to 3D using Cross-Domain Diffusion [105.16622018766236]
Wonder3Dは、単一視点画像から高忠実なテクスチャメッシュを効率的に生成する新しい手法である。
画像から3Dまでのタスクの品質,一貫性,効率性を総括的に改善するため,領域間拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-10-23T15:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。