論文の概要: BCLNet: Bilateral Consensus Learning for Two-View Correspondence Pruning
- arxiv url: http://arxiv.org/abs/2401.03459v1
- Date: Sun, 7 Jan 2024 11:38:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 18:48:58.779689
- Title: BCLNet: Bilateral Consensus Learning for Two-View Correspondence Pruning
- Title(参考訳): bclnet: 2視点対応pruningのための双方向コンセンサス学習
- Authors: Xiangyang Miao, Guobao Xiao, Shiping Wang, Jun Yu
- Abstract要約: 対応プルーニングは、2つの関連する画像間の信頼性の高い対応を確立することを目的としている。
既存のアプローチでは、ローカルとグローバルのコンテキストを扱うために、プログレッシブな戦略を採用することが多い。
本稿では,2視点対応型プルーニングタスクにおいて,双方向のコンセンサスを取得するための並列コンテキスト学習戦略を提案する。
- 参考スコア(独自算出の注目度): 26.400567961735234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Correspondence pruning aims to establish reliable correspondences between two
related images and recover relative camera motion. Existing approaches often
employ a progressive strategy to handle the local and global contexts, with a
prominent emphasis on transitioning from local to global, resulting in the
neglect of interactions between different contexts. To tackle this issue, we
propose a parallel context learning strategy that involves acquiring bilateral
consensus for the two-view correspondence pruning task. In our approach, we
design a distinctive self-attention block to capture global context and
parallel process it with the established local context learning module, which
enables us to simultaneously capture both local and global consensuses. By
combining these local and global consensuses, we derive the required bilateral
consensus. We also design a recalibration block, reducing the influence of
erroneous consensus information and enhancing the robustness of the model. The
culmination of our efforts is the Bilateral Consensus Learning Network
(BCLNet), which efficiently estimates camera pose and identifies inliers (true
correspondences). Extensive experiments results demonstrate that our network
not only surpasses state-of-the-art methods on benchmark datasets but also
showcases robust generalization abilities across various feature extraction
techniques. Noteworthily, BCLNet obtains 3.98\% mAP5$^{\circ}$ gains over the
second best method on unknown outdoor dataset, and obviously accelerates model
training speed. The source code will be available at:
https://github.com/guobaoxiao/BCLNet.
- Abstract(参考訳): 対応プルーニングは、2つの関連画像間の信頼できる対応を確立し、相対的なカメラの動きを復元することを目的としている。
既存のアプローチでは、ローカルとグローバルのコンテキストを扱うためにプログレッシブな戦略を採用しており、ローカルからグローバルへの移行に重点を置いており、結果として異なるコンテキスト間の相互作用が無視される。
この問題に対処するために,2視点対応型プルーニングタスクにおいて,双方向のコンセンサスを取得するための並列コンテキスト学習戦略を提案する。
提案手法では,グローバルなコンテキストと並列処理を確立されたローカルなコンテキスト学習モジュールで行うことで,ローカルなコンセンサスとグローバルなコンセンサスの両方を同時にキャプチャする,ユニークな自己注意ブロックを設計する。
これらの地域的およびグローバルなコンセンサスを組み合わせることで、必要な二国間コンセンサスを導出する。
また、再校正ブロックを設計し、誤ったコンセンサス情報の影響を低減し、モデルの堅牢性を高める。
BCLNet(Bilateral Consensus Learning Network)は,カメラのポーズを効率的に推定し,不整合(真の対応)を識別するネットワークである。
大規模な実験の結果、我々のネットワークはベンチマークデータセットの最先端の手法を超えるだけでなく、様々な特徴抽出技術にまたがる堅牢な一般化能力も示している。
注目すべきは、bclnetは未知の屋外データセットで2番目に良い方法よりも3.98\% map5$^{\circ}$ゲインを取得し、明らかにモデルのトレーニング速度を加速する。
ソースコードはhttps://github.com/guobaoxiao/bclnet。
関連論文リスト
- Deep Boosting Learning: A Brand-new Cooperative Approach for Image-Text Matching [53.05954114863596]
画像テキストマッチングのための新しいDeep Boosting Learning (DBL)アルゴリズムを提案する。
アンカーブランチは、まずデータプロパティに関する洞察を提供するために訓練される。
ターゲットブランチは、一致したサンプルと未一致のサンプルとの相対距離をさらに拡大するために、より適応的なマージン制約を同時に課される。
論文 参考訳(メタデータ) (2024-04-28T08:44:28Z) - Mutual Guidance and Residual Integration for Image Enhancement [43.282397174228116]
本稿では,効果的な双方向グローバルローカル情報交換を行うための相互誘導ネットワーク(MGN)を提案する。
本設計では,グローバルな関係のモデリングに重点を置き,一方がローカルな情報処理にコミットする2ブランチのフレームワークを採用する。
その結果、グローバルとローカルの両方のブランチは、相互情報集約のメリットを享受できる。
論文 参考訳(メタデータ) (2022-11-25T06:12:39Z) - PointCMC: Cross-Modal Multi-Scale Correspondences Learning for Point
Cloud Understanding [0.875967561330372]
自己教師付きポイントクラウド表現学習のためのマルチスケール対応をモダリティ間でモデル化するクロスモーダル手法
ポイントCMCは,(1) 局所的局所幾何学的特徴を最適化して局所的対応を学習する局所的-局所的(L2L)モジュール,(2) 局所的-グローバル的(L2G)モジュール,(3) 局所的-グローバル的(G2G)モジュール,(3) 局所的雲と画像間の協調的大域的コントラスト損失を利用して高レベルの意味的対応を学習するグローバル的(G2G)モジュールから構成される。
論文 参考訳(メタデータ) (2022-11-22T06:08:43Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Global-and-Local Collaborative Learning for Co-Salient Object Detection [162.62642867056385]
Co-Salient Object Detection (CoSOD)の目標は、2つ以上の関連する画像を含むクエリグループに一般的に現れる有能なオブジェクトを見つけることである。
本稿では,グローバル対応モデリング(GCM)とローカル対応モデリング(LCM)を含む,グローバル・ローカル協調学習アーキテクチャを提案する。
提案したGLNetは3つの一般的なCoSODベンチマークデータセットに基づいて評価され、我々のモデルが小さなデータセット(約3k画像)でトレーニングされた場合、一部の大規模データセット(約8k-200k画像)でトレーニングされた11の最先端の競合製品(約8k-200k画像)を上回っていることを示す。
論文 参考訳(メタデータ) (2022-04-19T14:32:41Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Enriching Local and Global Contexts for Temporal Action Localization [0.0]
私たちは、人気のある2段階の時間的局所化フレームワークにおいて、ローカルとグローバルの両方のコンテキストを豊かにしています。
提案モデルはContextLocと呼ばれ,L-Net,G-Net,P-Netの3つのサブネットワークに分割できる。
提案手法の有効性は,THUMOS14 (54.3% at IoU@0.5) と ActivityNet v1.3 (51.24% at IoU@0.5) を用いて実験的に検証した。
論文 参考訳(メタデータ) (2021-07-27T17:25:40Z) - Global Context Aware RCNN for Object Detection [1.1939762265857436]
我々はGCA (Global Context Aware) RCNNと呼ばれる新しいエンドツーエンドのトレーニング可能なフレームワークを提案する。
GCAフレームワークの中核となるコンポーネントは、グローバルな特徴ピラミッドとアテンション戦略の両方を特徴抽出と特徴改善に使用する、コンテキスト認識メカニズムである。
最後に,モデルの複雑さと計算負担をわずかに増加させる軽量バージョンを提案する。
論文 参考訳(メタデータ) (2020-12-04T14:56:46Z) - Disentangled Non-Local Neural Networks [68.92293183542131]
局所的でないブロックを深く研究し、注意を2つの項に分けることができることを示した。
両項の学習を容易にするために両項を分離した非局所ブロックを提示する。
論文 参考訳(メタデータ) (2020-06-11T17:59:22Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。