論文の概要: T-Graph: Enhancing Sparse-view Camera Pose Estimation by Pairwise Translation Graph
- arxiv url: http://arxiv.org/abs/2505.01207v1
- Date: Fri, 02 May 2025 11:50:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:20.011729
- Title: T-Graph: Enhancing Sparse-view Camera Pose Estimation by Pairwise Translation Graph
- Title(参考訳): T-Graph: ペアワイズ翻訳グラフによるスパースビューカメラポース推定の強化
- Authors: Qingyu Xian, Weiqin Jiao, Hao Cheng, Berend Jan van der Zwaag, Yanqiu Huang,
- Abstract要約: T-Graphは軽量でプラグアンドプレイのモジュールで、スパースビュー設定でのカメラポーズ推定を強化する。
入力としてペア画像の特徴を取り込み、MLP(Multilayer Perceptron)を通してそれらをマップする。
その後、完全に接続された翻訳グラフを構築し、ノードはカメラとエッジを表現し、翻訳関係を符号化する。
- 参考スコア(独自算出の注目度): 3.3301244688278078
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sparse-view camera pose estimation, which aims to estimate the 6-Degree-of-Freedom (6-DoF) poses from a limited number of images captured from different viewpoints, is a fundamental yet challenging problem in remote sensing applications. Existing methods often overlook the translation information between each pair of viewpoints, leading to suboptimal performance in sparse-view scenarios. To address this limitation, we introduce T-Graph, a lightweight, plug-and-play module to enhance camera pose estimation in sparse-view settings. T-graph takes paired image features as input and maps them through a Multilayer Perceptron (MLP). It then constructs a fully connected translation graph, where nodes represent cameras and edges encode their translation relationships. It can be seamlessly integrated into existing models as an additional branch in parallel with the original prediction, maintaining efficiency and ease of use. Furthermore, we introduce two pairwise translation representations, relative-t and pair-t, formulated under different local coordinate systems. While relative-t captures intuitive spatial relationships, pair-t offers a rotation-disentangled alternative. The two representations contribute to enhanced adaptability across diverse application scenarios, further improving our module's robustness. Extensive experiments on two state-of-the-art methods (RelPose++ and Forge) using public datasets (C03D and IMC PhotoTourism) validate both the effectiveness and generalizability of T-Graph. The results demonstrate consistent improvements across various metrics, notably camera center accuracy, which improves by 1% to 6% from 2 to 8 viewpoints.
- Abstract(参考訳): 6-Degree-of-Freedom (6-DoF) のポーズを、異なる視点から捉えた限られた数の画像から推定することを目的としたスパースビューカメラのポーズ推定は、リモートセンシングアプリケーションにおいて根本的な課題である。
既存の手法は、各視点間の翻訳情報を見落とし、スパース・ビューのシナリオにおいて、最適以下のパフォーマンスをもたらすことが多い。
この制限に対処するために、スパースビュー設定におけるカメラポーズ推定を強化する軽量なプラグアンドプレイモジュールであるT-Graphを導入する。
Tグラフは、ペア画像の特徴を入力として、それらをMLP(Multilayer Perceptron)を通してマップする。
その後、完全に接続された翻訳グラフを構築し、ノードはカメラとエッジを表現し、翻訳関係を符号化する。
従来の予測と並行して既存のモデルにシームレスに統合することができ、効率性と使いやすさを維持できる。
さらに、異なる局所座標系で定式化された2つのペアワイズ変換表現、相対tと対tを導入する。
相対tは直感的な空間関係をキャプチャするが、対tは回転異方性を提供する。
この2つの表現は、多様なアプリケーションシナリオにおける適応性の向上に寄与し、モジュールの堅牢性をさらに向上させます。
公開データセット(C03DとIMC PhotoTourism)を用いた2つの最先端手法(RelPose++とForge)の大規模な実験により、Tグラフの有効性と一般化性が検証された。
その結果、カメラセンターの精度は2から8の視点で1%から6%向上した。
関連論文リスト
- SRPose: Two-view Relative Pose Estimation with Sparse Keypoints [51.49105161103385]
SRPoseは、カメラ・トゥ・ワールドおよびオブジェクト・トゥ・カメラシナリオにおける2ビュー相対ポーズ推定のためのスパースキーポイントベースのフレームワークである。
精度と速度の点で最先端の手法と比較して、競争力や優れた性能を達成する。
さまざまな画像サイズやカメラ固有の機能に対して堅牢であり、低コンピューティングリソースでデプロイすることができる。
論文 参考訳(メタデータ) (2024-07-11T05:46:35Z) - FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation [30.710296843150832]
画像間の相対的なカメラのポーズを推定することは、コンピュータビジョンにおいて中心的な問題となっている。
私たちのアプローチは、正確かつ堅牢な結果をもたらします。
包括的解析は設計選択をサポートし,提案手法が様々な特徴抽出器や対応推定器に柔軟に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-03-05T18:59:51Z) - RelPose++: Recovering 6D Poses from Sparse-view Observations [66.6922660401558]
スパースビュー画像集合(2-8画像)から6次元カメラポーズを推定する作業に対処する。
我々は,画像対上の相対回転よりも分布を推定するネットワークを学習するRelPoseフレームワークを構築した。
最終システムは,先行技術よりも6次元ポーズ予測を大幅に改善する。
論文 参考訳(メタデータ) (2023-05-08T17:59:58Z) - Leveraging Image Matching Toward End-to-End Relative Camera Pose Regression [13.233301155616616]
本稿では,2つの画像間の相対的なポーズ回帰のための一般化可能なエンドツーエンドの深層学習手法を提案する。
従来のパイプラインにインスパイアされた本手法では,画像マッチング(IM)を,相対的ポーズ回帰のための事前学習タスクとして活用する。
提案手法をいくつかのデータセット上で評価し,従来のエンドツーエンド手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-11-27T22:01:47Z) - E-Graph: Minimal Solution for Rigid Rotation with Extensibility Graphs [61.552125054227595]
重なり合う領域を持たない2つの画像間の相対的な回転推定を解くために,新しい最小解を提案する。
E-Graphに基づいて、回転推定問題はより単純でエレガントになる。
回転推定戦略を6-DoFカメラのポーズと高密度3Dメッシュモデルを得る完全カメラ追跡マッピングシステムに組み込む。
論文 参考訳(メタデータ) (2022-07-20T16:11:48Z) - PoserNet: Refining Relative Camera Poses Exploiting Object Detections [14.611595909419297]
我々は、明示的な意味的オブジェクト検出よりも、ポーズ推定問題を導くために、オブジェクトネス領域を使用する。
本稿では,ペアワイド相対カメラのポーズを近似的に改善する軽量グラフネットワーク Pose Refiner Network (PoserNet) を提案する。
グラフのサイズによって異なる7-Scenesデータセットを評価し、このプロセスが最適化に基づくMotion Averagingアルゴリズムにどのように役立つかを示す。
論文 参考訳(メタデータ) (2022-07-19T17:58:33Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - GeoGraph: Learning graph-based multi-view object detection with
geometric cues end-to-end [10.349116753411742]
複数のビューから静的な都市オブジェクトを検出するエンド・ツー・エンドの学習可能なアプローチを提案する。
提案手法はグラフニューラルネットワーク(GNN)を用いて全ての物体を検出し,その位置を出力する。
我々のGNNは、相対的なポーズと画像の証拠を同時にモデル化し、任意の数の入力ビューを扱うことができる。
論文 参考訳(メタデータ) (2020-03-23T09:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。