論文の概要: MD-Net: Multi-Detector for Local Feature Extraction
- arxiv url: http://arxiv.org/abs/2208.05350v1
- Date: Wed, 10 Aug 2022 13:52:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-08-11 13:01:02.779658
- Title: MD-Net: Multi-Detector for Local Feature Extraction
- Title(参考訳): MD-Net:局所特徴抽出のためのマルチ検出器
- Authors: Emanuele Santellani (1), Christian Sormann (1), Mattia Rossi (2),
Andreas Kuhn (2), Friedrich Fraundorfer (1) ((1) Graz University of
Technology, (2) Sony Europe B.V.)
- Abstract要約: 本稿では,各画像におけるキーポイントの相補的な集合を予め定義した数で検出できるディープ特徴抽出ネットワークを提案する。
我々は、キーポイントを予測するためにネットワークをトレーニングし、対応するディスクリプタを共同で計算する。
広範にわたる実験により,我々のネットワークは,合成的に歪んだ画像のみに基づいて訓練され,3次元再構成と再局在化タスクにおける競合的な結果が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Establishing a sparse set of keypoint correspon dences between images is a
fundamental task in many computer vision pipelines. Often, this translates into
a computationally expensive nearest neighbor search, where every keypoint
descriptor at one image must be compared with all the descriptors at the
others. In order to lower the computational cost of the matching phase, we
propose a deep feature extraction network capable of detecting a predefined
number of complementary sets of keypoints at each image. Since only the
descriptors within the same set need to be compared across the different
images, the matching phase computational complexity decreases with the number
of sets. We train our network to predict the keypoints and compute the
corresponding descriptors jointly. In particular, in order to learn
complementary sets of keypoints, we introduce a novel unsupervised loss which
penalizes intersections among the different sets. Additionally, we propose a
novel descriptor-based weighting scheme meant to penalize the detection of
keypoints with non-discriminative descriptors. With extensive experiments we
show that our feature extraction network, trained only on synthetically warped
images and in a fully unsupervised manner, achieves competitive results on 3D
reconstruction and re-localization tasks at a reduced matching complexity.
- Abstract(参考訳): 多くのコンピュータビジョンパイプラインでは、画像間のキーポイント応答のばらばらなセットを確立することが基本的なタスクである。
多くの場合、これは計算コストの高い近接探索に変換され、ある画像のすべてのキーポイント記述子を他の画像の全ての記述子と比較しなければならない。
マッチングフェーズの計算コストを下げるため,各画像における相補的なキーポイントの集合数を予め定義した数で検出できるディープ特徴抽出ネットワークを提案する。
同じ集合内の記述子のみを異なる画像間で比較する必要があるため、一致する位相計算の複雑さは集合の数によって減少する。
ネットワークをトレーニングしてキーポイントを予測し、対応するディスクリプタを共同で計算します。
特に、キーポイントの補完的な集合を学ぶために、異なる集合間の交点をペナライズする新しい教師なし損失を導入する。
さらに,非識別的記述子によるキーポイントの検出をペナルティ化する,新しい記述子に基づく重み付け手法を提案する。
広範な実験により,合成歪画像のみを訓練した特徴抽出ネットワークが,マッチング複雑性を低減した3次元再構成と再局所化タスクにおいて,競争力のある結果が得られることを示した。
関連論文リスト
- Improving the matching of deformable objects by learning to detect
keypoints [6.4587163310833855]
本研究では,非剛性画像対応タスクにおける正しいマッチング数を増やすための新しい学習キーポイント検出手法を提案する。
我々はエンドツーエンドの畳み込みニューラルネットワーク(CNN)をトレーニングし、考慮された記述子により適したキーポイント位置を見つける。
実験により,本手法は検出手法と併用して多数の記述子の平均マッチング精度を向上させることを示した。
また,本手法を,現在利用可能な最も優れたキーポイント検出器と同等に動作する複雑な実世界のタスクオブジェクト検索に適用する。
論文 参考訳(メタデータ) (2023-09-01T13:02:19Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - Minimum Description Length Clustering to Measure Meaningful Image
Complexity [65.268245109828]
本稿では,階層的なパッチクラスタリングによる画像複雑性の指標を提案する。
最小記述長の原理を用いて、クラスタ数を決定し、特定の点を外れ値として指定し、ホワイトノイズを低いスコアに正しく割り当てる。
論文 参考訳(メタデータ) (2023-06-26T15:37:04Z) - DDM-NET: End-to-end learning of keypoint feature Detection, Description
and Matching for 3D localization [34.66510265193038]
本稿では,キーポイント検出,記述子表現,フレーム間マッチングを共同で学習するエンドツーエンドフレームワークを提案する。
我々は特徴検出とマッチングの両方のための自己教師付き画像ワープ対応損失を設計する。
また,不整合/不整合一致と不整合一致の両方を頑健に処理する新たな損失を提案する。
論文 参考訳(メタデータ) (2022-12-08T21:43:56Z) - Fast Key Points Detection and Matching for Tree-Structured Images [4.929206987094714]
本稿では,木状パターンを用いたナノ解像度視覚識別子の画像マッチングに基づく新しい認証アルゴリズムを提案する。
提案アルゴリズムは様々な木構造画像マッチングに適用できるが,近年開発された視覚的識別子であるデンドライトに焦点をあてる。
論文 参考訳(メタデータ) (2022-11-07T00:22:56Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Compositional Sketch Search [91.84489055347585]
フリーハンドスケッチを用いて画像コレクションを検索するアルゴリズムを提案する。
シーン構成全体を特定するための簡潔で直感的な表現として描画を利用する。
論文 参考訳(メタデータ) (2021-06-15T09:38:09Z) - A region-based descriptor network for uniformly sampled keypoints [35.394659345406865]
異なる画像のキーポイントペアをマッチングすることは、コンピュータビジョンの基本タスクです。
ほとんどの方法は、高い信頼性で特徴点の座標を得るためにカスタマイズされた極端点スキームを必要とします。
本稿では,ディープネットワークのコンテキスト特徴を組み合わせることで,地域ベースの記述子を設計する。
論文 参考訳(メタデータ) (2021-01-26T07:31:22Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - Compact Deep Aggregation for Set Retrieval [87.52470995031997]
画像の大規模データセットから複数の顔を含む画像を取得することに焦点を当てる。
ここでは、セットは各画像の顔記述子で構成され、複数のIDに対するクエリが与えられた後、すべてのIDを含む画像を取得することが目標である。
このコンパクトディスクリプタは,画像毎に最大2面まで識別性の低下が最小限に抑えられ,その後徐々に劣化することを示す。
論文 参考訳(メタデータ) (2020-03-26T08:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。