論文の概要: Geometry Depth Consistency in RGBD Relative Pose Estimation
- arxiv url: http://arxiv.org/abs/2401.00639v1
- Date: Mon, 1 Jan 2024 02:35:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 16:34:04.614208
- Title: Geometry Depth Consistency in RGBD Relative Pose Estimation
- Title(参考訳): rgbd相対ポーズ推定における幾何学的深さ整合性
- Authors: Sourav Kumar, Chiang-Heng Chien, Benjamin Kimia
- Abstract要約: RGBDカメラの相対的なポーズ推定は多くのアプリケーションにおいて重要である。
以前のアプローチでは画像のRGBの側面に頼って推定し、したがって推定プロセスの深さを完全には利用しない。
本稿では,RGBに基づくランク付き対応リストから一対の対応が仮定された場合,残余対応の空間は,仮説付き対応リストの周辺に営まれる曲線の対に制限され,暗黙的に深度整合を捉えていることを示す。
- 参考スコア(独自算出の注目度): 2.6089354079273512
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Relative pose estimation for RGBD cameras is crucial in a number of
applications. Previous approaches either rely on the RGB aspect of the images
to estimate pose thus not fully making use of depth in the estimation process
or estimate pose from the 3D cloud of points that each image produces, thus not
making full use of RGB information. This paper shows that if one pair of
correspondences is hypothesized from the RGB-based ranked-ordered
correspondence list, then the space of remaining correspondences is restricted
to corresponding pairs of curves nested around the hypothesized correspondence,
implicitly capturing depth consistency. This simple Geometric Depth Constraint
(GDC) significantly reduces potential matches. In effect this becomes a filter
on possible correspondences that helps reduce the number of outliers and thus
expedites RANSAC significantly. As such, the same budget of time allows for
more RANSAC iterations and therefore additional robustness and a significant
speedup. In addition, the paper proposed a Nested RANSAC approach that also
speeds up the process, as shown through experiments on TUM, ICL-NUIM, and RGBD
Scenes v2 datasets.
- Abstract(参考訳): RGBDカメラの相対的なポーズ推定は多くのアプリケーションにおいて重要である。
以前のアプローチでは画像のRGBの側面に頼って推定ポーズを推定し、したがって推定プロセスの深さを十分に利用したり、各画像が生成する点の3Dクラウドから推定ポーズを推定したりせず、RGB情報をフル活用しなかった。
本稿では,RGBに基づくランク付き対応リストから一対の対応が仮定された場合,残余対応の空間は仮説付き対応リストの周辺に営まれる曲線の対に制限され,暗黙的に深さの整合性を捉える。
この単純な幾何学的深さ制約(gdc)はポテンシャルマッチングを著しく減少させる。
事実上、これは外乱の数を減らし、RANSACを著しく高速化する可能性のある対応のフィルタとなる。
そのため、同じ予算でRANSACのイテレーションが増加し、さらなる堅牢性と大幅なスピードアップが可能になる。
さらに、本論文では、TUM、ICL-NUIM、RGBD Scenes v2データセットの実験で示されているように、プロセスを高速化するNested RANSACアプローチを提案する。
関連論文リスト
- Depth-Guided Semi-Supervised Instance Segmentation [62.80063539262021]
Semi-Supervised Instance (SSIS)は、トレーニング中にラベルなしデータの量を活用することを目的としている。
従来のフレームワークは主に、ラベルなし画像のRGB情報を利用して擬似ラベルを生成する。
この制限を克服するために、Depth-Guided (DG)フレームワークを導入します。
論文 参考訳(メタデータ) (2024-06-25T09:36:50Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Quantity-Aware Coarse-to-Fine Correspondence for Image-to-Point Cloud
Registration [4.954184310509112]
Image-to-point cloud registrationは、RGBイメージと参照ポイントクラウドの間の相対カメラのポーズを決定することを目的としている。
個々の点と画素とのマッチングは、モダリティギャップによって本質的に曖昧である。
本稿では,局所点集合と画素パッチ間の量認識対応を捉える枠組みを提案する。
論文 参考訳(メタデータ) (2023-07-14T03:55:54Z) - Symmetric Uncertainty-Aware Feature Transmission for Depth
Super-Resolution [52.582632746409665]
カラー誘導DSRのためのSymmetric Uncertainty-aware Feature Transmission (SUFT)を提案する。
本手法は最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T06:35:59Z) - DPODv2: Dense Correspondence-Based 6 DoF Pose Estimation [24.770767430749288]
DPODv2(Dense Pose Object Detector)と呼ばれる3ステージ6DoFオブジェクト検出手法を提案する。
本研究では,2次元物体検出器と高密度対応推定ネットワークを組み合わせることで,フル6DFのポーズを推定する多視点ポーズ補正手法を提案する。
DPODv2は、使用済みのデータモダリティとトレーニングデータの種類によらず、高速でスケーラブルなまま、すべてのデータに対して優れた結果を得る。
論文 参考訳(メタデータ) (2022-07-06T16:48:56Z) - Boosting RGB-D Saliency Detection by Leveraging Unlabeled RGB Images [89.81919625224103]
RGB-D Salient Object Detection (SOD) のための深層モデルの訓練は、しばしば多数のラベル付きRGB-D画像を必要とする。
本稿では、ラベルのないRGB画像を活用するために、Dual-Semi RGB-D Salient Object Detection Network (DS-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:02:27Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。