論文の概要: Local Consensus Enhanced Siamese Network with Reciprocal Loss for
Two-view Correspondence Learning
- arxiv url: http://arxiv.org/abs/2308.03217v1
- Date: Sun, 6 Aug 2023 22:20:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 15:50:49.162284
- Title: Local Consensus Enhanced Siamese Network with Reciprocal Loss for
Two-view Correspondence Learning
- Title(参考訳): 相互損失を考慮した2視点対応学習のためのローカルコンセンサス強化シームズネットワーク
- Authors: Linbo Wang, Jing Wu, Xianyong Fang, Zhengyi Liu, Chenjie Cao, Yanwei
Fu
- Abstract要約: 2視点対応学習は通常、一致の信頼性と相対的なポーズを共同で予測するエンドツーエンドネットワークを確立する。
本稿では,既存のモデルの特徴を増強するローカル・フィーチャー・コンセンサス (LFC) プラグイン・ブロックを提案する。
我々は既存のモデルを相互予測の監督を生かした相互損失を伴うシームズネットワークに拡張する。
- 参考スコア(独自算出の注目度): 35.5851523517487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies of two-view correspondence learning usually establish an
end-to-end network to jointly predict correspondence reliability and relative
pose. We improve such a framework from two aspects. First, we propose a Local
Feature Consensus (LFC) plugin block to augment the features of existing
models. Given a correspondence feature, the block augments its neighboring
features with mutual neighborhood consensus and aggregates them to produce an
enhanced feature. As inliers obey a uniform cross-view transformation and share
more consistent learned features than outliers, feature consensus strengthens
inlier correlation and suppresses outlier distraction, which makes output
features more discriminative for classifying inliers/outliers. Second, existing
approaches supervise network training with the ground truth correspondences and
essential matrix projecting one image to the other for an input image pair,
without considering the information from the reverse mapping. We extend
existing models to a Siamese network with a reciprocal loss that exploits the
supervision of mutual projection, which considerably promotes the matching
performance without introducing additional model parameters. Building upon
MSA-Net, we implement the two proposals and experimentally achieve
state-of-the-art performance on benchmark datasets.
- Abstract(参考訳): 2視点対応学習の最近の研究は、通常、一致の信頼性と相対的なポーズを共同で予測するエンドツーエンドネットワークを確立する。
私たちはこのフレームワークを2つの側面から改善する。
まず,既存のモデルの特徴を増大させるため,LFC(Local Feature Consensus)プラグインブロックを提案する。
対応機能を与えられたブロックは、近隣のコンセンサスを相互に拡張し、それを集約して強化された特徴を生成する。
inlier は一様クロスビュー変換に従い、outlier よりもより一貫性のある学習機能を共有するため、feature consensus は inlier correlation を強化し、outlier distraction を抑制する。
第二に、既存のアプローチでは、逆マッピングの情報を考慮することなく、1つのイメージをもう1つのイメージに投影する基本行列と基底真理対応によるネットワークトレーニングを監督する。
我々は、相互投影の監督を生かした相互損失を伴って既存のモデルをシームズネットワークに拡張し、追加のモデルパラメータを導入することなくマッチング性能を大幅に向上させる。
msa-netに基づいて2つの提案を実装し,ベンチマークデータセットにおける最先端のパフォーマンスを実験的に達成した。
関連論文リスト
- Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文 参考訳(メタデータ) (2024-03-17T07:02:55Z) - Dual-stream contrastive predictive network with joint handcrafted
feature view for SAR ship classification [9.251342335645765]
本稿では,新しいデュアルストリームコントラスト予測ネットワーク(DCPNet)を提案する。
最初のタスクは正のサンプルペアを構築し、コアエンコーダにより一般的な表現を学習させることである。
第2の課題は, 深部特徴と手話特徴との対応を適応的に把握し, モデル内での知識伝達を実現し, 特徴融合による冗長性を効果的に改善することである。
論文 参考訳(メタデータ) (2023-11-26T05:47:01Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - Recurrent Feedback Improves Recognition of Partially Occluded Objects [1.452875650827562]
人工ニューラルネットワークが再発の恩恵を受けるかどうかについて検討する。
競合パラメトリック複雑性のフィードフォワードモデルと比較して,繰り返しモデルでは分類精度が有意に高いことがわかった。
論文 参考訳(メタデータ) (2021-04-21T16:18:34Z) - Online Multiple Object Tracking with Cross-Task Synergy [120.70085565030628]
位置予測と埋め込み結合の相乗効果を考慮した新しい統一モデルを提案する。
この2つのタスクは、時間認識対象の注意と注意の注意、およびアイデンティティ認識メモリ集約モデルによってリンクされる。
論文 参考訳(メタデータ) (2021-04-01T10:19:40Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。