論文の概要: Online Invariance Selection for Local Feature Descriptors
- arxiv url: http://arxiv.org/abs/2007.08988v3
- Date: Thu, 23 Jul 2020 15:16:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 14:14:38.277972
- Title: Online Invariance Selection for Local Feature Descriptors
- Title(参考訳): 局所特徴記述子のオンライン不変選択
- Authors: R\'emi Pautrat, Viktor Larsson, Martin R. Oswald and Marc Pollefeys
- Abstract要約: 現在の特徴記述子の制限は、一般化と差別力のトレードオフである。
本稿では,この制限を,局所的な記述子における不変性の分散と,その文脈に与えられた最も適切な不変性のオンライン選択によって克服することを提案する。
提案手法は,現在のディスクリプタの性能を向上し,複数のマッチングタスクにおいて最先端のディスクリプタより優れていることを示す。
- 参考スコア(独自算出の注目度): 93.32949876169785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To be invariant, or not to be invariant: that is the question formulated in
this work about local descriptors. A limitation of current feature descriptors
is the trade-off between generalization and discriminative power: more
invariance means less informative descriptors. We propose to overcome this
limitation with a disentanglement of invariance in local descriptors and with
an online selection of the most appropriate invariance given the context. Our
framework consists in a joint learning of multiple local descriptors with
different levels of invariance and of meta descriptors encoding the regional
variations of an image. The similarity of these meta descriptors across images
is used to select the right invariance when matching the local descriptors. Our
approach, named Local Invariance Selection at Runtime for Descriptors (LISRD),
enables descriptors to adapt to adverse changes in images, while remaining
discriminative when invariance is not required. We demonstrate that our method
can boost the performance of current descriptors and outperforms
state-of-the-art descriptors in several matching tasks, when evaluated on
challenging datasets with day-night illumination as well as viewpoint changes.
- Abstract(参考訳): 不変であるか不変でないかは、この研究で定式化された局所記述子に関する質問である。
現在の特徴記述子の制限は、一般化と識別力の間のトレードオフである。
この制限を克服するために,局所記述子における不変性の解消と,文脈を考慮した最も適切な不変性のオンライン選択を提案する。
本フレームワークは, 画像の局所的な変化を符号化した複数の局所記述子とメタ記述子との連成学習から構成される。
画像間のメタディスクリプタの類似性は、ローカルディスクリプタと一致するときに正しい不変性を選択するために使用される。
提案手法はLISRD (Local Invariance Selection at Runtime for Descriptors) と名付けられ, 画像の悪質な変化に適応すると同時に, 不分散が不要な場合には識別性を維持する。
提案手法は,昼夜照明による課題データセットや視点変化の評価において,現在のディスクリプタの性能を向上し,いくつかのマッチングタスクにおいて最先端のディスクリプタよりも優れることを示す。
関連論文リスト
- Feature Aligning Few shot Learning Method Using Local Descriptors Weighted Rules [0.0]
ラベル付きサンプルの限られた数を使用して、新しいカテゴリを識別することを含む分類はほとんどない。
本稿では,局所記述子重み付きルール(FAFD-LDWR)を用いたFew-shot学習手法を提案する。
ローカルディスクリプタの識別情報を可能な限り保存するために、クロスノーマライゼーション手法を少数ショット画像分類に革新的に導入し、サポートのキーローカルディスクリプタとクエリセットを整列させて、バックグラウンドノイズを除去することで分類性能を向上させる。
論文 参考訳(メタデータ) (2024-08-26T11:36:38Z) - A Simple Task-aware Contrastive Local Descriptor Selection Strategy for Few-shot Learning between inter class and intra class [6.204356280380338]
少ない画像分類は、ラベル付きサンプルの少ない新しいクラスを分類することを目的としている。
近年の研究では、深部局所記述子は表現能力に優れていた。
本稿では,タスク対応コントラスト型ローカル記述子選択ネットワーク(TCDSNet)を提案する。
論文 参考訳(メタデータ) (2024-08-12T07:04:52Z) - Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.14084801851381]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。
既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。
本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T13:00:33Z) - Context-aware Difference Distilling for Multi-change Captioning [106.72151597074098]
マルチチェンジキャプションは、自然言語でイメージペア内の複雑で結合的な変化を記述することを目的としている。
そこで本稿では, 文収量に対する真の変化をすべて捉えるための, 文脈認識型差分蒸留ネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-31T14:07:39Z) - TALDS-Net: Task-Aware Adaptive Local Descriptors Selection for Few-shot Image Classification [6.204356280380338]
少ない画像分類は、見知らぬ新しいクラスを少数のサンプルで分類することを目的としている。
近年の研究では、深部局所記述子は画像レベルの特徴に比べて表現能力が向上していることが示されている。
タスク対応型ローカル記述子選択ネットワーク(TALDS-Net)を提案する。
論文 参考訳(メタデータ) (2023-12-09T03:33:14Z) - Text Descriptions are Compressive and Invariant Representations for
Visual Learning [63.3464863723631]
本研究では,クラスごとの複数の視覚的特徴に対する人間の理解に則って,頑健な数ショット学習環境では魅力的な性能が得られることを示す。
特に,SLR-AVD (Sparse Logistic Regression using Augmented Visual Descriptors) という新しい手法を導入する。
このメソッドはまず、まず大きな言語モデル(LLM)を介して各クラスの複数の視覚的記述を自動生成し、次にVLMを使用してこれらの記述を各画像の視覚的特徴埋め込みに変換し、最後に、これらの特徴の関連するサブセットを選択するためにスパースロジスティック回帰を使用する。
論文 参考訳(メタデータ) (2023-07-10T03:06:45Z) - Learning Rotation-Equivariant Features for Visual Correspondence [41.79256655501003]
本稿では,識別的回転不変記述子を抽出する自己教師型学習フレームワークを提案する。
グループ同変CNNを利用することで、回転同変の特徴とその配向を効果的に学習する。
本手法は,既存の回転不変ディスクリプタ間で,回転の異なる状態のマッチング精度を示す。
論文 参考訳(メタデータ) (2023-03-25T13:42:07Z) - Visual Classification via Description from Large Language Models [23.932495654407425]
視覚言語モデル(VLM)は、様々な認識タスクにおいて有望な性能を示す。
本稿では,VLMを用いた分類のための代替フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-13T17:03:46Z) - VLAD-VSA: Cross-Domain Face Presentation Attack Detection with
Vocabulary Separation and Adaptation [87.9994254822078]
顔提示攻撃(PAD)の場合、スプーフィングキューのほとんどは微妙で局所的な画像パターンである。
VLADアグリゲーション法は,特徴空間を局所的に分割する視覚語彙を用いて局所特徴を定量化する。
提案する語彙分離法は,語彙をドメイン共有語とドメイン固有語に分割する。
論文 参考訳(メタデータ) (2022-02-21T15:27:41Z) - Same Features, Different Day: Weakly Supervised Feature Learning for
Seasonal Invariance [65.94499390875046]
「夜も昼も」は2つのことが全く違うことを暗示するためによく使われる表現である。
本研究の目的は、局所化、スパースマッチング、画像検索に使用できる高密度特徴表現を提供することである。
Deja-Vuは、画素単位の地上真実データを必要としない季節不変の特徴を学習するための弱い教師付きアプローチである。
論文 参考訳(メタデータ) (2020-03-30T12:56:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。