Fugu-MT 論文翻訳(概要): Looking Beyond Corners: Contrastive Learning of Visual Representations for Keypoint Detection and Description Extraction

論文の概要: Looking Beyond Corners: Contrastive Learning of Visual Representations for Keypoint Detection and Description Extraction

arxiv url: http://arxiv.org/abs/2112.12002v1
Date: Wed, 22 Dec 2021 16:27:11 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-23 15:23:20.905041
Title: Looking Beyond Corners: Contrastive Learning of Visual Representations for Keypoint Detection and Description Extraction
Title（参考訳）: look beyond corners: キーポイント検出と説明抽出のための視覚的表現のコントラスト学習
Authors: Henrique Siqueira, Patrick Ruhkamp, Ibrahim Halfaoui, Markus Karmann, Onay Urfalioglu
Abstract要約: 学習可能なキーポイント検出器とディスクリプタは、古典的な手作りの特徴抽出方法よりも優れています。視覚表現の自己教師型学習に関する最近の研究は、深層ネットワークに基づく学習可能なモデルの性能向上を促している。本稿では,繰り返し可能なキーポイントを検知し,識別的記述を抽出する対応ネットワーク(CorrNet)を提案する。
参考スコア（独自算出の注目度）: 1.5749416770494706
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learnable keypoint detectors and descriptors are beginning to outperform classical hand-crafted feature extraction methods. Recent studies on self-supervised learning of visual representations have driven the increasing performance of learnable models based on deep networks. By leveraging traditional data augmentations and homography transformations, these networks learn to detect corners under adverse conditions such as extreme illumination changes. However, their generalization capabilities are limited to corner-like features detected a priori by classical methods or synthetically generated data. In this paper, we propose the Correspondence Network (CorrNet) that learns to detect repeatable keypoints and to extract discriminative descriptions via unsupervised contrastive learning under spatial constraints. Our experiments show that CorrNet is not only able to detect low-level features such as corners, but also high-level features that represent similar objects present in a pair of input images through our proposed joint guided backpropagation of their latent space. Our approach obtains competitive results under viewpoint changes and achieves state-of-the-art performance under illumination changes.
Abstract（参考訳）: 学習可能なキーポイント検出器とディスクリプタは、古典的な手作りの特徴抽出方法よりも優れ始めている。視覚表現の自己教師型学習に関する最近の研究は、深層ネットワークに基づく学習可能なモデルの性能向上を促している。従来のデータ拡張やホモグラフィ変換を活用することで、これらのネットワークは、極端な照明変化などの悪条件下でのコーナーの検出を学習する。しかし、それらの一般化能力は古典的手法や合成データによって検出されたコーナーのような特徴に限られる。本稿では,繰り返し可能なキーポイントを検知し,空間的制約下で教師なしのコントラスト学習を通じて識別的記述を抽出する対応ネットワーク(CorrNet)を提案する。実験の結果,corrnetはコーナーなどの低レベルな特徴を検出できるだけでなく,入力画像に類似するオブジェクトを表す高レベルな特徴を,潜在空間の共役的なバックプロパゲーションによって検出できることがわかった。提案手法は視点変化下での競争結果を求め,照度変化による最先端性能を実現する。

関連論文リスト

Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳（メタデータ） (2025-05-23T15:05:56Z)
"Principal Components" Enable A New Language of Images [79.45806370905775]
証明可能なPCAのような構造を潜在トークン空間に組み込む新しい視覚トークン化フレームワークを導入する。提案手法は、最先端の再構築性能を実現し、人間の視覚システムとの整合性を向上する。
論文参考訳（メタデータ） (2025-03-11T17:59:41Z)
From classical techniques to convolution-based models: A review of object detection algorithms [0.562479170374811]
物体検出はコンピュータビジョンと画像理解の基本的な課題である。手作りの特徴と浅いモデルに頼っていた伝統的な手法は、複雑な視覚データに悩まされ、限られた性能を示した。ディープラーニング、特に畳み込みニューラルネットワーク(CNN)は、データから直接リッチで階層的な機能を自動的に学習することで、これらの制限に対処した。
論文参考訳（メタデータ） (2024-12-06T18:32:54Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Efficient Visualization of Neural Networks with Generative Models and Adversarial Perturbations [0.0]
本稿では,既存の手法を改良した生成ネットワークによるディープビジュアライゼーション手法を提案する。我々のモデルは、使用するネットワーク数を減らし、ジェネレータと識別器のみを必要とすることにより、アーキテクチャを単純化する。我々のモデルは、事前の訓練知識を少なくし、差別者がガイドとして機能する非敵的訓練プロセスを使用する。
論文参考訳（メタデータ） (2024-09-20T14:59:25Z)
Learning Object-Centric Representation via Reverse Hierarchy Guidance [73.05170419085796]
OCL(Object-Centric Learning)は、ニューラルネットワークが視覚的なシーンで個々のオブジェクトを識別できるようにする。 RHGNetは、トレーニングと推論プロセスにおいて、さまざまな方法で機能するトップダウンパスを導入している。我々のモデルは、よく使われる複数のデータセット上でSOTA性能を達成する。
論文参考訳（メタデータ） (2024-05-17T07:48:27Z)
Automatic Discovery of Visual Circuits [66.99553804855931]
本稿では,視覚モデルにおける視覚的概念の認識の基盤となる計算グラフのサブグラフを抽出するスケーラブルな手法について検討する。提案手法は, モデル出力に因果的に影響を及ぼす回路を抽出し, これらの回路を編集することで, 敵攻撃から大きな事前学習モデルを守ることができることがわかった。
論文参考訳（メタデータ） (2024-04-22T17:00:57Z)
High-Discriminative Attribute Feature Learning for Generalized Zero-Shot Learning [54.86882315023791]
一般化ゼロショット学習(HDAFL)のための高識別属性特徴学習(High-Discriminative Attribute Feature Learning)という革新的な手法を提案する。 HDAFLは複数の畳み込みカーネルを使用して、画像の属性と高い相関性を持つ識別領域を自動的に学習する。また、属性間の識別能力を高めるために、Transformerベースの属性識別エンコーダを導入する。
論文参考訳（メタデータ） (2024-04-07T13:17:47Z)
Enhancing Deformable Local Features by Jointly Learning to Detect and Describe Keypoints [8.390939268280235]
局所特徴抽出は、画像マッチングや検索といった重要なタスクに対処するためのコンピュータビジョンにおける標準的なアプローチである。鍵点を共同で検出・記述する新しい変形認識ネットワークであるDALFを提案する。提案手法は、変形可能なオブジェクト検索と、非剛性な3次元表面登録という、2つの実世界のアプリケーションの性能を向上させる。
論文参考訳（メタデータ） (2023-04-02T18:01:51Z)
Active Visual Exploration Based on Attention-Map Entropy [13.064016215754163]
注意マップエントロピー(AME: Attention-Map Entropy)と呼ばれる新しい手法を導入する。 AMEは、トレーニングを単純化する余分なロスコンポーネントを必要としない。このような簡易なトレーニングは、公開データセットの再構成、セグメンテーション、分類の性能を大幅に向上させることを示す。
論文参考訳（メタデータ） (2023-03-11T17:14:30Z)
Learning Common Rationale to Improve Self-Supervised Representation for Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。 SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文参考訳（メタデータ） (2023-03-03T02:07:40Z)
Adversarial Feature Augmentation and Normalization for Visual Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文参考訳（メタデータ） (2021-03-22T20:36:34Z)
RoRD: Rotation-Robust Descriptors and Orthographic Views for Local Feature Matching [32.10261486751993]
本稿では,データ拡張と視点投影による不変記述子の学習を組み合わせる新しい枠組みを提案する。提案手法の有効性をポーズ推定や視覚的位置認識などの重要課題に対して評価する。
論文参考訳（メタデータ） (2021-03-15T17:40:25Z)
Revisiting Edge Detection in Convolutional Neural Networks [3.5281112495479245]
ニューラルネットワークの第1畳み込み層においてエッジを適切に表現することはできないことを示す。エッジ検出ユニットを提案し,性能損失を低減し,定性的に異なる表現を生成することを示す。
論文参考訳（メタデータ） (2020-12-25T13:53:04Z)
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文参考訳（メタデータ） (2020-04-20T02:47:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。