論文の概要: Graph-CoVis: GNN-based Multi-view Panorama Global Pose Estimation
- arxiv url: http://arxiv.org/abs/2304.13201v1
- Date: Wed, 26 Apr 2023 00:04:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 16:06:12.848172
- Title: Graph-CoVis: GNN-based Multi-view Panorama Global Pose Estimation
- Title(参考訳): Graph-CoVis:GNNに基づくマルチビューパノラマグローバルポーズ推定
- Authors: Negar Nejatishahidin, Will Hutchcroft, Manjunath Narayana, Ivaylo
Boyadzhiev, Yuguang Li, Naji Khosravan, Jana Kosecka, Sing Bing Kang
- Abstract要約: Graph-CoVisは、共同視覚構造とグローバルモーションを共同で学習する、新しいグラフニューラルネットワークベースのアーキテクチャである。
我々のモデルは最先端のアプローチと競争的に機能することを示します。
- 参考スコア(独自算出の注目度): 11.8322612639007
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we address the problem of wide-baseline camera pose estimation
from a group of 360$^\circ$ panoramas under upright-camera assumption. Recent
work has demonstrated the merit of deep-learning for end-to-end direct relative
pose regression in 360$^\circ$ panorama pairs [11]. To exploit the benefits of
multi-view logic in a learning-based framework, we introduce Graph-CoVis, which
non-trivially extends CoVisPose [11] from relative two-view to global
multi-view spherical camera pose estimation. Graph-CoVis is a novel Graph
Neural Network based architecture that jointly learns the co-visible structure
and global motion in an end-to-end and fully-supervised approach. Using the
ZInD [4] dataset, which features real homes presenting wide-baselines,
occlusion, and limited visual overlap, we show that our model performs
competitively to state-of-the-art approaches.
- Abstract(参考訳): 本稿では,360$^\circ$パノラマ群から,直立カメラ仮定下での広ベースカメラポーズ推定の問題に対処する。
近年の研究では,360$^\circ$ Panorama pairs[11]において,エンドツーエンドの直接ポーズ回帰の深層学習のメリットが示されている。
学習ベースフレームワークにおけるマルチビューロジックの利点を活用するために,CoVisPose[11]を相対的な2ビューからグローバルな多ビュー球面カメラのポーズ推定に非自明に拡張したGraph-CoVisを導入する。
Graph-CoVisは、エンドツーエンドで完全に教師されたアプローチで、共同視覚構造とグローバルモーションを共同で学習する、新しいグラフニューラルネットワークベースのアーキテクチャである。
ZInD [4]データセットは、幅広いベースライン、オクルージョン、限られた視覚的オーバーラップを実家に提供するもので、我々のモデルは最先端のアプローチと競争的に機能することを示す。
関連論文リスト
- 3D Scene Geometry Estimation from 360$^\circ$ Imagery: A Survey [1.3654846342364308]
本稿では,先駆的かつ最先端の3次元シーン形状推定手法に関する包括的調査を行う。
まず、球面カメラモデルの基本概念を再考し、最も一般的な取得技術と表現形式についてレビューする。
次に、単色レイアウトと深度推論のアプローチを調査し、球面データに適した学習ベースソリューションの最近の進歩を強調した。
論文 参考訳(メタデータ) (2024-01-17T14:57:27Z) - Multi-Spectral Image Stitching via Spatial Graph Reasoning [52.27796682972484]
空間グラフ推論に基づくマルチスペクトル画像縫合法を提案する。
同一のビュー位置から複数スケールの補完機能をノードに埋め込む。
空間的・チャネル的次元に沿った長距離コヒーレンスを導入することにより、画素関係の相補性とチャネル相互依存性は、整列したマルチビュー特徴の再構築に寄与する。
論文 参考訳(メタデータ) (2023-07-31T15:04:52Z) - PanoGRF: Generalizable Spherical Radiance Fields for Wide-baseline
Panoramas [54.4948540627471]
広帯域パノラマのための一般化可能な球面放射場パノGRFを提案する。
パノGRFは、視線画像に基づいて訓練された一般化可能な放射場とは異なり、パノラマからパースペクティブへの変換から情報損失を回避する。
複数のパノラマデータセットの結果は、パノGRFが最先端の一般化可能なビュー合成法よりも著しく優れていることを示している。
論文 参考訳(メタデータ) (2023-06-02T13:35:07Z) - E-Graph: Minimal Solution for Rigid Rotation with Extensibility Graphs [61.552125054227595]
重なり合う領域を持たない2つの画像間の相対的な回転推定を解くために,新しい最小解を提案する。
E-Graphに基づいて、回転推定問題はより単純でエレガントになる。
回転推定戦略を6-DoFカメラのポーズと高密度3Dメッシュモデルを得る完全カメラ追跡マッピングシステムに組み込む。
論文 参考訳(メタデータ) (2022-07-20T16:11:48Z) - Ollivier-Ricci Curvature For Head Pose Estimation From a Single Image [10.842428621768667]
本稿では,ネットワーク曲率の概念を適用し,単一の画像から頭部ポーズを推定することを目的とする。
本研究では、XGBoost回帰モデルへの入力として重み付きグラフ上のOllivier-Ricci曲率(ORC)の幾何学的概念を用いて、ORCの固有幾何学的基礎が自然なアプローチであることを示す。
論文 参考訳(メタデータ) (2022-04-27T15:20:26Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Panoramic Panoptic Segmentation: Towards Complete Surrounding
Understanding via Unsupervised Contrastive Learning [97.37544023666833]
我々は,パノラマパオプティックセグメンテーションを最も総合的なシーン理解として導入する。
完全な周囲の理解は、エージェントに最大限の情報を提供する。
標準ピンホール画像のモデルトレーニングを可能にし、学習した機能を異なるドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-01T09:37:27Z) - Perspective Plane Program Induction from a Single Image [85.28956922100305]
本研究では,自然画像の全体像を推定する逆グラフ問題について検討する。
我々は、この問題を、入力画像の最もよく記述されたカメラポーズとシーン構造を共同で発見するものとして定式化する。
提案するフレームワークであるP3Iは,探索に基づくアルゴリズムと勾配に基づくアルゴリズムを組み合わせて効率よく問題を解く。
論文 参考訳(メタデータ) (2020-06-25T21:18:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。