論文の概要: GRelPose: Generalizable End-to-End Relative Camera Pose Regression
- arxiv url: http://arxiv.org/abs/2211.14950v1
- Date: Sun, 27 Nov 2022 22:01:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 18:30:00.911211
- Title: GRelPose: Generalizable End-to-End Relative Camera Pose Regression
- Title(参考訳): GRelPose: 汎用的なエンドツーエンドの相対カメラ
- Authors: Fadi Khatib, Yuval Margalit, Meirav Galun, Ronen Basri
- Abstract要約: 同じシーンの2つの画像が与えられた場合、このアルゴリズムは2つのカメラ間の相対回転と変換を予測する。
提案手法では,事前学習したLoFTRネットワークを用いて,各入力画像の粗い特徴のグリッドを抽出するネットワークアーキテクチャを提案する。
その後、2つの画像の対応する特徴を関連付け、最終的に畳み込みネットワークを用いて各カメラ間の相対回転と変換を復元する。
- 参考スコア(独自算出の注目度): 17.062045616622868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a generalizable, end-to-end deep learning-based method
for relative pose regression between two images. Given two images of the same
scene captured from different viewpoints, our algorithm predicts the relative
rotation and translation between the two respective cameras. Despite recent
progress in the field, current deep-based methods exhibit only limited
generalization to scenes not seen in training. Our approach introduces a
network architecture that extracts a grid of coarse features for each input
image using the pre-trained LoFTR network. It subsequently relates
corresponding features in the two images, and finally uses a convolutional
network to recover the relative rotation and translation between the respective
cameras. Our experiments indicate that the proposed architecture can generalize
to novel scenes, obtaining higher accuracy than existing deep-learning-based
methods in various settings and datasets, in particular with limited training
data.
- Abstract(参考訳): 本稿では,2つの画像間の相対的なポーズ回帰のための一般化可能なエンドツーエンドの深層学習手法を提案する。
異なる視点から撮影した同一シーンの2つの画像から、本アルゴリズムは2つのカメラ間の相対回転と変換を予測する。
この分野の最近の進歩にもかかわらず、現在の深層ベース手法は訓練中に見えないシーンへの限定的な一般化しか示していない。
本手法では,事前学習したLoFTRネットワークを用いて,入力画像毎に粗い特徴のグリッドを抽出するネットワークアーキテクチャを提案する。
その後、2つの画像の対応する特徴を関連付け、最終的に畳み込みネットワークを用いて各カメラ間の相対回転と変換を復元する。
提案手法は,様々な設定やデータセット,特に限られたトレーニングデータにおいて,既存のディープラーニング手法よりも精度が向上し,新たな場面に一般化できることを示す。
関連論文リスト
- DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation [30.710296843150832]
画像間の相対的なカメラのポーズを推定することは、コンピュータビジョンにおいて中心的な問題となっている。
私たちのアプローチは、正確かつ堅牢な結果をもたらします。
包括的解析は設計選択をサポートし,提案手法が様々な特徴抽出器や対応推定器に柔軟に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-03-05T18:59:51Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Self-Supervised Learning of Image Scale and Orientation [35.94215211409985]
本研究では,興味のある画像領域に対して特徴的ポーズ,すなわちスケールと向きを割り当てる学習の課題について検討する。
モデルが直接学習する明示的なポーズアノテーションを持つ画像領域の大規模な集合を得ることは困難である。
ヒストグラムアライメント技術を用いた自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-15T02:43:39Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - RELMOBNET: A Robust Two-Stage End-To-End Training Approach For
MOBILENETV3 Based Relative Camera Pose Estimation [0.6193838300896449]
相対カメラポーズ推定は3次元再構成と視覚的位置推定において重要な役割を担っている。
本稿では,MobileNetV3-LargeをベースとしたSiameseネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-25T17:27:26Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Visual Camera Re-Localization Using Graph Neural Networks and Relative
Pose Supervision [31.947525258453584]
視覚再局在化とは、単一の画像を入力として、予め記録された環境に対してカメラの位置と向きを推定する手段である。
提案手法は特別な仮定をほとんど行わず,訓練やテストでは極めて軽量である。
標準の屋内(7-Scenes)と屋外(Cambridge Landmarks)のカメラ再ローカリゼーションベンチマークに対するアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2021-04-06T14:29:03Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - Paying Attention to Activation Maps in Camera Pose Regression [4.232614032390374]
カメラポーズ回帰手法は、クエリ画像に単一のフォワードパスを適用してカメラポーズを推定する。
畳み込みアクティベーションマップをシーケンシャル入力として使用するポーズ回帰のための注意に基づくアプローチを提案する。
提案手法は,現代のポーズレグレッサー方式に好適に比較し,複数のベンチマークにまたがる最先端の精度を実現する。
論文 参考訳(メタデータ) (2021-03-21T20:10:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。