論文の概要: Improving the matching of deformable objects by learning to detect
keypoints
- arxiv url: http://arxiv.org/abs/2309.00434v2
- Date: Tue, 12 Sep 2023 07:18:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 16:31:50.160077
- Title: Improving the matching of deformable objects by learning to detect
keypoints
- Title(参考訳): キーポイント検出学習による変形可能な物体のマッチング改善
- Authors: Felipe Cadar and Welerson Melo and Vaishnavi Kanagasabapathi and
Guilherme Potje and Renato Martins and Erickson R. Nascimento
- Abstract要約: 本研究では,非剛性画像対応タスクにおける正しいマッチング数を増やすための新しい学習キーポイント検出手法を提案する。
我々はエンドツーエンドの畳み込みニューラルネットワーク(CNN)をトレーニングし、考慮された記述子により適したキーポイント位置を見つける。
実験により,本手法は検出手法と併用して多数の記述子の平均マッチング精度を向上させることを示した。
また,本手法を,現在利用可能な最も優れたキーポイント検出器と同等に動作する複雑な実世界のタスクオブジェクト検索に適用する。
- 参考スコア(独自算出の注目度): 6.4587163310833855
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a novel learned keypoint detection method to increase the number
of correct matches for the task of non-rigid image correspondence. By
leveraging true correspondences acquired by matching annotated image pairs with
a specified descriptor extractor, we train an end-to-end convolutional neural
network (CNN) to find keypoint locations that are more appropriate to the
considered descriptor. For that, we apply geometric and photometric warpings to
images to generate a supervisory signal, allowing the optimization of the
detector. Experiments demonstrate that our method enhances the Mean Matching
Accuracy of numerous descriptors when used in conjunction with our detection
method, while outperforming the state-of-the-art keypoint detectors on real
images of non-rigid objects by 20 p.p. We also apply our method on the complex
real-world task of object retrieval where our detector performs on par with the
finest keypoint detectors currently available for this task. The source code
and trained models are publicly available at
https://github.com/verlab/LearningToDetect_PRL_2023
- Abstract(参考訳): 本研究では,非剛性画像対応タスクにおける正しいマッチング数を増やすための新しい学習キーポイント検出手法を提案する。
注釈付き画像対と特定のディスクリプタ抽出器とのマッチングによって得られた真の対応を利用して、エンド・ツー・エンドの畳み込みニューラルネットワーク(CNN)をトレーニングし、検討されたディスクリプタにより適したキーポイント位置を見つける。
そこで,画像に幾何学的および測光的ワーピングを適用し,監視信号を生成し,検出器の最適化を可能にする。
実験により,本手法は,検出手法と併用して多数の記述子の平均マッチング精度を向上させるとともに,非剛体物体の実像における最先端のキーポイント検出器の性能を20p以上で向上させ,また,この課題に現在利用可能な最も優れたキーポイント検出器と同等に動作するオブジェクト検索の複雑な実世界のタスクにも適用できることを示した。
ソースコードとトレーニングされたモデルはhttps://github.com/verlab/LearningToDetect_PRL_2023で公開されている。
関連論文リスト
- Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images [76.47980643420375]
本稿では,意味的対応の学習に固有のデータ・ハングリー・マターが存在するという仮説に基づく。
我々は,機械の監督を通じて,ペア化されたキーポイントを確実に強化する単純な機械注釈器を実証する。
我々のモデルは,SPair-71k,PF-PASCAL,PF-WILLOWといった意味対応学習ベンチマークの最先端モデルを上回る。
論文 参考訳(メタデータ) (2023-11-30T13:22:15Z) - PrObeD: Proactive Object Detection Wrapper [15.231600709902127]
PrObeDはエンコーダ・デコーダアーキテクチャで構成されており、エンコーダネットワークは入力画像の暗号化のために画像依存の信号テンプレートを生成する。
本稿では,プロアクティブな手法に基づくラッパーPrObeDを提案する。
PrObeDの適用後,MS-COCO,CAMO,COD$10$K,NC$4$Kのデータセットを用いた実験を行った。
論文 参考訳(メタデータ) (2023-10-28T19:25:01Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - Enhancing Deformable Local Features by Jointly Learning to Detect and
Describe Keypoints [8.390939268280235]
局所特徴抽出は、画像マッチングや検索といった重要なタスクに対処するためのコンピュータビジョンにおける標準的なアプローチである。
鍵点を共同で検出・記述する新しい変形認識ネットワークであるDALFを提案する。
提案手法は、変形可能なオブジェクト検索と、非剛性な3次元表面登録という、2つの実世界のアプリケーションの性能を向上させる。
論文 参考訳(メタデータ) (2023-04-02T18:01:51Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - ObjectFormer for Image Manipulation Detection and Localization [118.89882740099137]
画像操作の検出とローカライズを行うObjectFormerを提案する。
画像の高周波特徴を抽出し,マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。
各種データセットについて広範な実験を行い,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-03-28T12:27:34Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Robust Place Recognition using an Imaging Lidar [45.37172889338924]
本研究では,画像lidarを用いたロバストなリアルタイム位置認識手法を提案する。
本手法は真不変であり,逆再訪と逆逆再訪に対処できる。
論文 参考訳(メタデータ) (2021-03-03T01:08:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。