論文の概要: Learning and aggregating deep local descriptors for instance-level
recognition
- arxiv url: http://arxiv.org/abs/2007.13172v1
- Date: Sun, 26 Jul 2020 16:30:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 20:01:25.828061
- Title: Learning and aggregating deep local descriptors for instance-level
recognition
- Title(参考訳): インスタンスレベル認識のための深部局所記述子の学習と集約
- Authors: Giorgos Tolias, Tomas Jenicek, Ond\v{r}ej Chum
- Abstract要約: トレーニングは、正と負のイメージペアの例のみを必要とする。
推論では、ローカルディスクリプタはネットワークの内部コンポーネントのアクティベートによって提供される。
バックボーンネットワークがResNet18ほど小さい場合もあります。
- 参考スコア(独自算出の注目度): 11.692327697598175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an efficient method to learn deep local descriptors for
instance-level recognition. The training only requires examples of positive and
negative image pairs and is performed as metric learning of sum-pooled global
image descriptors. At inference, the local descriptors are provided by the
activations of internal components of the network. We demonstrate why such an
approach learns local descriptors that work well for image similarity
estimation with classical efficient match kernel methods. The experimental
validation studies the trade-off between performance and memory requirements of
the state-of-the-art image search approach based on match kernels. Compared to
existing local descriptors, the proposed ones perform better in two
instance-level recognition tasks and keep memory requirements lower. We
experimentally show that global descriptors are not effective enough at large
scale and that local descriptors are essential. We achieve state-of-the-art
performance, in some cases even with a backbone network as small as ResNet18.
- Abstract(参考訳): インスタンスレベル認識のための深部局所記述子を効率的に学習する手法を提案する。
トレーニングには、正と負のイメージペアの例のみが必要であり、サムプールされたグローバルイメージ記述子のメトリック学習として実行される。
推論では、ローカルディスクリプタはネットワークの内部コンポーネントの活性化によって提供される。
このような手法が画像類似度推定に有効である局所記述子を古典的マッチングカーネル法で学習する理由を実証する。
実験検証では,matchカーネルに基づく最先端画像探索手法の性能とメモリ要求のトレードオフについて検討した。
既存のローカルディスクリプタと比較して、2つのインスタンスレベルの認識タスクで性能が向上し、メモリ要求を低く抑える。
我々は,グローバルディスクリプタが大規模に有効ではないこと,局所ディスクリプタが不可欠であることを実験的に示す。
resnet18ほど小さなバックボーンネットワークでも、最先端のパフォーマンスを実現しています。
関連論文リスト
- Leveraging Semantic Cues from Foundation Vision Models for Enhanced Local Feature Correspondence [12.602194710071116]
本稿では,基礎視覚モデルの特徴から意味的手がかりを抽出し,局所的特徴マッチングを強化する手法を提案する。
カメラのローカライゼーションにおける性能は平均29%向上し,既存の6つのディスクリプタの適応版を提示する。
論文 参考訳(メタデータ) (2024-10-12T13:45:26Z) - FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization [57.59857784298536]
直接2D-3Dマッチングアルゴリズムでは、メモリが大幅に削減されるが、より大きくあいまいな検索空間のために精度が低下する。
本研究では,2次元3次元探索フレームワーク内の重み付き平均演算子を用いて局所的およびグローバルな記述子を融合させることにより,この曖昧さに対処する。
ローカルのみのシステムの精度を常に改善し、メモリ要求を半減させながら階層的な手法に近い性能を達成する。
論文 参考訳(メタデータ) (2024-08-21T23:42:16Z) - A Simple Task-aware Contrastive Local Descriptor Selection Strategy for Few-shot Learning between inter class and intra class [6.204356280380338]
少ない画像分類は、ラベル付きサンプルの少ない新しいクラスを分類することを目的としている。
近年の研究では、深部局所記述子は表現能力に優れていた。
本稿では,タスク対応コントラスト型ローカル記述子選択ネットワーク(TCDSNet)を提案する。
論文 参考訳(メタデータ) (2024-08-12T07:04:52Z) - Residual Learning for Image Point Descriptors [56.917951170421894]
本稿では,手作りの検出器とディスクリプタを用いて局所画像記述子を学習する,非常にシンプルで効果的な手法を提案する。
我々は,手書き記述子にすでに存在する知識を活用することで,最終記述子を最適化する。
本手法は,非微分関数を用いたアンサンブル学習や学習に応用できる可能性がある。
論文 参考訳(メタデータ) (2023-12-24T12:51:30Z) - TALDS-Net: Task-Aware Adaptive Local Descriptors Selection for Few-shot Image Classification [6.204356280380338]
少ない画像分類は、見知らぬ新しいクラスを少数のサンプルで分類することを目的としている。
近年の研究では、深部局所記述子は画像レベルの特徴に比べて表現能力が向上していることが示されている。
タスク対応型ローカル記述子選択ネットワーク(TALDS-Net)を提案する。
論文 参考訳(メタデータ) (2023-12-09T03:33:14Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - ReMarNet: Conjoint Relation and Margin Learning for Small-Sample Image
Classification [49.87503122462432]
ReMarNet(Relation-and-Margin Learning Network)と呼ばれるニューラルネットワークを導入する。
本手法は,上記2つの分類機構の双方において優れた性能を発揮する特徴を学習するために,異なるバックボーンの2つのネットワークを組み立てる。
4つの画像データセットを用いた実験により,本手法はラベル付きサンプルの小さな集合から識別的特徴を学習するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-06-27T13:50:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。