論文の概要: ALIKE: Accurate and Lightweight Keypoint Detection and Descriptor
Extraction
- arxiv url: http://arxiv.org/abs/2112.02906v1
- Date: Mon, 6 Dec 2021 10:10:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 16:27:07.624637
- Title: ALIKE: Accurate and Lightweight Keypoint Detection and Descriptor
Extraction
- Title(参考訳): ALIKE: 高精度で軽量なキーポイント検出と記述子抽出
- Authors: Xiaoming Zhao, Xingming Wu, Jinyu Miao, Weihai Chen, Peter C. Y. Chen,
and Zhengguo Li
- Abstract要約: 本稿では,高精度なサブピクセルキーポイントを出力する可変キーポイント検出モジュールを提案する。
次に、これらのサブピクセルキーポイントを直接最適化するために再投影損失を提案し、分散ピーク損失を正確なキーポイント正規化のために提示する。
軽量ネットワークはキーポイント検出とディスクリプタ抽出のために設計されており、商用GPU上で640x480の画像に対して毎秒95フレームで動作する。
- 参考スコア(独自算出の注目度): 21.994171434960734
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Existing methods detect the keypoints in a non-differentiable way, therefore
they can not directly optimize the position of keypoints through
back-propagation. To address this issue, we present a differentiable keypoint
detection module, which outputs accurate sub-pixel keypoints. The reprojection
loss is then proposed to directly optimize these sub-pixel keypoints, and the
dispersity peak loss is presented for accurate keypoints regularization. We
also extract the descriptors in a sub-pixel way, and they are trained with the
stable neural reprojection error loss. Moreover, a lightweight network is
designed for keypoint detection and descriptor extraction, which can run at 95
frames per second for 640x480 images on a commercial GPU. On homography
estimation, camera pose estimation, and visual (re-)localization tasks, the
proposed method achieves equivalent performance with the state-of-the-art
approaches, while greatly reduces the inference time.
- Abstract(参考訳): 既存の方法はキーポイントを非微分可能な方法で検出するため、バックプロパゲーションによってキーポイントの位置を直接最適化することはできない。
この問題に対処するため、正確なサブピクセルキーポイントを出力する可変キーポイント検出モジュールを提案する。
次に、これらのサブピクセルキーポイントを直接最適化するために再投影損失を提案し、分散ピーク損失を正確なキーポイント正規化のために提示する。
また,そのデリプタをサブピクセルの方法で抽出し,安定な神経再投射エラー損失で学習する。
さらに、軽量ネットワークはキーポイント検出とディスクリプタ抽出のために設計されており、商用GPU上の640x480イメージに対して毎秒95フレームで動作する。
ホモグラフィ推定,カメラポーズ推定,視覚(再)ローカライズタスクにおいて,提案手法は最先端手法で同等の性能を実現するとともに,推定時間を大幅に削減する。
関連論文リスト
- Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - KGNv2: Separating Scale and Pose Prediction for Keypoint-based 6-DoF
Grasp Synthesis on RGB-D input [16.897624250286487]
画像入力によるキーポイント型グリップ検出器は有望な結果を示した。
そこで我々は,キーポイント推定への依存性を低減できる新たなグリップ生成ネットワークを考案した。
論文 参考訳(メタデータ) (2023-03-09T23:11:52Z) - BALF: Simple and Efficient Blur Aware Local Feature Detector [14.044093492945334]
局所特徴検出は多くの画像処理とコンピュータビジョンアプリケーションの主要な要素である。
本稿では,不明瞭な画像中の有意なキーポイントを正確に局所化できる,効率的かつ効果的なキーポイント検出法を提案する。
本手法は, 新たな多層パーセプトロン(MLP)アーキテクチャの利点を生かし, ぼやけた画像の検出再現性を著しく向上させる。
論文 参考訳(メタデータ) (2022-11-27T05:29:57Z) - Self-Supervised Equivariant Learning for Oriented Keypoint Detection [35.94215211409985]
我々は、回転同変CNNを用いた自己教師付き学習フレームワークを導入し、ロバスト指向キーポイントの検出を学習する。
ヒストグラムに基づく配向マップのトレーニングのために,合成変換により生成した画像対による高密度配向損失を提案する。
提案手法は,画像マッチングベンチマークとカメラポーズ推定ベンチマークにおいて,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-19T02:26:07Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Pixel-Perfect Structure-from-Motion with Featuremetric Refinement [96.73365545609191]
複数視点からの低レベル画像情報を直接アライメントすることで、動きからの2つの重要なステップを洗練する。
これにより、様々なキーポイント検出器のカメラポーズとシーン形状の精度が大幅に向上する。
本システムは,大規模な画像コレクションに容易にスケールできるので,クラウドソースによる大規模なローカライゼーションを実現することができる。
論文 参考訳(メタデータ) (2021-08-18T17:58:55Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - OSKDet: Towards Orientation-sensitive Keypoint Localization for Rotated
Object Detection [0.0]
オリエンテーション感度キーポイントに基づく回転検出器OSKDetを提案する。
ターゲットを特徴付けるキーポイントのセットを採用し、roi上のキーポイントヒートマップを予測して回転したターゲットを形成する。
DOTAは77.81%、HRSC2016は89.91%、UCAS-AODは97.18%である。
論文 参考訳(メタデータ) (2021-04-18T03:40:52Z) - 6DoF Object Pose Estimation via Differentiable Proxy Voting Loss [113.72905482334767]
我々は,投票手順における仮説選択を模倣した,微分可能な代行投票損失(DPVL)を開発する。
LINEMOD と Occlusion LINEMOD という,広く使用されているデータセットの実験により,DPVL がポーズ推定性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-02-10T16:33:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。