論文の概要: ALIKED: A Lighter Keypoint and Descriptor Extraction Network via
Deformable Transformation
- arxiv url: http://arxiv.org/abs/2304.03608v2
- Date: Sun, 16 Apr 2023 01:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 20:06:45.245746
- Title: ALIKED: A Lighter Keypoint and Descriptor Extraction Network via
Deformable Transformation
- Title(参考訳): ALIKED:変形可能な変換による軽量キーポイントと記述子抽出ネットワーク
- Authors: Xiaoming Zhao, Xingming Wu, Weihai Chen, Peter C. Y. Chen, Qingsong
Xu, and Zhengguo Li
- Abstract要約: 本稿では,各キーポイントに対するサポート機能の変形可能な位置を学習し,変形可能な記述子を構成するSparse Deformable Descriptor Head (SDDH)を提案する。
提案するネットワークは,画像マッチング,3次元再構成,視覚的再局在化など,様々な視覚計測タスクにおいて効率的かつ強力であることを示す。
- 参考スコア(独自算出の注目度): 27.04762347838776
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Image keypoints and descriptors play a crucial role in many visual
measurement tasks. In recent years, deep neural networks have been widely used
to improve the performance of keypoint and descriptor extraction. However, the
conventional convolution operations do not provide the geometric invariance
required for the descriptor. To address this issue, we propose the Sparse
Deformable Descriptor Head (SDDH), which learns the deformable positions of
supporting features for each keypoint and constructs deformable descriptors.
Furthermore, SDDH extracts descriptors at sparse keypoints instead of a dense
descriptor map, which enables efficient extraction of descriptors with strong
expressiveness. In addition, we relax the neural reprojection error (NRE) loss
from dense to sparse to train the extracted sparse descriptors. Experimental
results show that the proposed network is both efficient and powerful in
various visual measurement tasks, including image matching, 3D reconstruction,
and visual relocalization.
- Abstract(参考訳): 画像キーポイントとディスクリプタは多くの視覚計測タスクにおいて重要な役割を果たす。
近年,キーポイントとディスクリプタ抽出の性能向上のために,ディープニューラルネットワークが広く利用されている。
しかし、従来の畳み込み演算は記述子に必要な幾何学的不変性を提供しない。
この問題に対処するために,各キーポイントに対するサポート機能の変形可能な位置を学習し,変形可能な記述子を構成するSparse Deformable Descriptor Head (SDDH)を提案する。
さらに、SDDHは密度の高い記述子マップの代わりにスパースキーポイントで記述子を抽出し、表現力の強い記述子を効率的に抽出することができる。
さらに,抽出したスパース記述子をトレーニングするために,ニューラルリジェクション誤差(NRE)の高密度からスパースへの損失を緩和する。
実験の結果,提案ネットワークは画像マッチング,3次元再構成,視覚的再局在化など,様々な視覚計測タスクにおいて効率的かつ強力であることがわかった。
関連論文リスト
- PEVA-Net: Prompt-Enhanced View Aggregation Network for Zero/Few-Shot Multi-View 3D Shape Recognition [8.15444057380305]
我々は、ゼロ/フェーショットの3D形状認識に対処するために、大きな視覚言語モデルであるCLIPを活用することに重点を置いている。
本稿では,0/fwショット3D形状認識を同時に行うために,Prompt-Enhanced View Aggregation Network (PEVA-Net)を提案する。
論文 参考訳(メタデータ) (2024-04-30T00:16:59Z) - KDD-LOAM: Jointly Learned Keypoint Detector and Descriptors Assisted
LiDAR Odometry and Mapping [9.609585217048664]
確率的検出損失を有するマルチタスク完全畳み込みネットワークに基づく密結合型キーポイント検出器とディスクリプタを提案する。
屋内および屋外の両方のデータセットで実験したところ、TCKDDはポイントクラウドの登録において最先端のパフォーマンスを達成することがわかった。
また、キーポイント検出器とディスクリプタ支援LiDAR odometry and Mapping framework (KDD-LOAM) を設計し、その実時間オドメトリはキーポイント記述子マッチングに基づくRANSACに依存している。
論文 参考訳(メタデータ) (2023-09-27T04:10:52Z) - Mini-PointNetPlus: a local feature descriptor in deep learning model for
3d environment perception [7.304195370862869]
そこで我々は,PointNet へのプラグイン・アンド・プレイの代替として,新しいローカル機能記述子 mini-PointNetPlus を提案する。
我々の基本的な考え方は、データポイントを考慮された個々の特徴に別々に投影することであり、それぞれが置換不変となる。
提案する記述子の特徴を十分に活用するため,3次元知覚の性能向上実験を行った。
論文 参考訳(メタデータ) (2023-07-25T07:30:28Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - Neural Implicit Dictionary via Mixture-of-Expert Training [111.08941206369508]
ニューラルインシシット辞書(NID)を学習することで、データとトレーニング効率の両方を達成する汎用INRフレームワークを提案する。
我々のNIDは、所望の関数空間にまたがるように調整された座標ベースのImpworksのグループを組み立てる。
実験の結果,NIDは最大98%の入力データで2次元画像や3次元シーンの再現を2桁高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-08T05:07:19Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Robust Place Recognition using an Imaging Lidar [45.37172889338924]
本研究では,画像lidarを用いたロバストなリアルタイム位置認識手法を提案する。
本手法は真不変であり,逆再訪と逆逆再訪に対処できる。
論文 参考訳(メタデータ) (2021-03-03T01:08:31Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Learning Feature Descriptors using Camera Pose Supervision [101.56783569070221]
本稿では,画像間の相対的なカメラポーズからのみ特徴記述子を学習可能な,弱教師付きフレームワークを提案する。
ピクセルレベルの地上通信はもはや不要なので、我々のフレームワークは、より大きく、より多様なデータセットのトレーニングを、より良い、偏見のない記述子に開放する。
論文 参考訳(メタデータ) (2020-04-28T06:35:27Z) - MGCN: Descriptor Learning using Multiscale GCNs [50.14172863706108]
グラフウェーブレットを用いて表面上のディリクレエネルギーを分解する新しい非学習的特徴を示す。
また,新たなグラフ畳み込みネットワーク (MGCN) を提案し,非学習的特徴をより差別的な記述子に変換する。
論文 参考訳(メタデータ) (2020-01-28T17:25:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。