論文の概要: Multi-scale Matching Networks for Semantic Correspondence
- arxiv url: http://arxiv.org/abs/2108.00211v1
- Date: Sat, 31 Jul 2021 10:57:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:19:53.138612
- Title: Multi-scale Matching Networks for Semantic Correspondence
- Title(参考訳): 意味対応のためのマルチスケールマッチングネットワーク
- Authors: Dongyang Zhao, Ziyang Song, Zhenghao Ji, Gangming Zhao, Weifeng Ge and
Yizhou Yu
- Abstract要約: 提案手法は,高い計算効率を有する3つの一般的なベンチマークに対して,最先端の性能を実現する。
我々のマルチスケールマッチングネットワークは、学習可能なパラメータをほとんど必要とせずに、エンドツーエンドで簡単に訓練できる。
- 参考スコア(独自算出の注目度): 38.904735120815346
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep features have been proven powerful in building accurate dense semantic
correspondences in various previous works. However, the multi-scale and
pyramidal hierarchy of convolutional neural networks has not been well studied
to learn discriminative pixel-level features for semantic correspondence. In
this paper, we propose a multi-scale matching network that is sensitive to tiny
semantic differences between neighboring pixels. We follow the coarse-to-fine
matching strategy and build a top-down feature and matching enhancement scheme
that is coupled with the multi-scale hierarchy of deep convolutional neural
networks. During feature enhancement, intra-scale enhancement fuses
same-resolution feature maps from multiple layers together via local
self-attention and cross-scale enhancement hallucinates higher-resolution
feature maps along the top-down hierarchy. Besides, we learn complementary
matching details at different scales thus the overall matching score is refined
by features of different semantic levels gradually. Our multi-scale matching
network can be trained end-to-end easily with few additional learnable
parameters. Experimental results demonstrate that the proposed method achieves
state-of-the-art performance on three popular benchmarks with high
computational efficiency.
- Abstract(参考訳): 深い特徴は、過去の様々な作品において正確な密接な意味対応を構築する上で強力であることが証明されている。
しかし、畳み込みニューラルネットワークのマルチスケールとピラミッド階層は、意味対応のための識別ピクセルレベルの特徴を学ぶためによく研究されていない。
本稿では,隣接する画素間のセマンティックな違いに敏感なマルチスケールマッチングネットワークを提案する。
我々は、粗大なマッチング戦略に従い、深層畳み込みニューラルネットワークのマルチスケール階層と結合したトップダウン機能とマッチング強化スキームを構築する。
機能拡張の間、イントラスケールエンハンスメントは、複数のレイヤから同じ解像度のフィーチャーマップをローカルなセルフアテンションとクロススケールエンハンスメントを通じて融合させ、トップダウン階層に沿って高分解能のフィーチャーマップを暗示する。
さらに、異なるスケールで補足的マッチングの詳細を学習し、異なるセマンティックレベルの特徴によって全体のマッチングスコアが徐々に洗練される。
我々のマルチスケールマッチングネットワークは、学習可能なパラメータの少ないエンドツーエンドで容易に訓練できる。
実験の結果,提案手法は計算効率の高い3つのベンチマークにおいて最先端の性能が得られることがわかった。
関連論文リスト
- Provable Guarantees for Nonlinear Feature Learning in Three-Layer Neural
Networks [49.808194368781095]
3層ニューラルネットワークは,2層ネットワークよりも特徴学習能力が豊富であることを示す。
この研究は、特徴学習体制における2層ネットワーク上の3層ニューラルネットワークの証明可能なメリットを理解するための前進である。
論文 参考訳(メタデータ) (2023-05-11T17:19:30Z) - DeepSim-Nets: Deep Similarity Networks for Stereo Image Matching [0.0]
本稿では,3つのマルチスケール類似学習アーキテクチャ,DeepSimネットワークを提案する。
これらのモデルは、対照的な損失を伴う画素レベルのマッチングを学習し、考慮されたシーンの幾何学に非依存である。
エピポーラ対のすべてのピクセルを同時に高密度に割り当てることを学ぶことによって、ハイブリッドとエンド・ツー・エンドのアプローチの中間点を確立する。
論文 参考訳(メタデータ) (2023-04-17T08:15:47Z) - Multi-scale and Cross-scale Contrastive Learning for Semantic
Segmentation [5.281694565226513]
セグメンテーションネットワークによって抽出されたマルチスケール特徴の識別能力を高めるために,コントラスト学習を適用した。
まず、エンコーダのマルチスケール表現を共通の特徴空間にマッピングすることにより、教師付き局所言語制約の新しい形式をインスタンス化する。
論文 参考訳(メタデータ) (2022-03-25T01:24:24Z) - Learning distinct features helps, provably [98.78384185493624]
最小二乗損失で訓練された2層ニューラルネットワークによって学習された特徴の多様性について検討する。
隠蔽層の特徴間の平均的な$L$-distanceで多様性を測定する。
論文 参考訳(メタデータ) (2021-06-10T19:14:45Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - GOCor: Bringing Globally Optimized Correspondence Volumes into Your
Neural Network [176.3781969089004]
特徴相関層は、画像ペア間の密接な対応を含むコンピュータビジョン問題において、重要なニューラルネットワークモジュールとして機能する。
我々は,特徴相関層の直接置換として機能する,完全に微分可能な密マッチングモジュール GOCor を提案する。
本手法は,幾何マッチング,光学フロー,密接なセマンティックマッチングのタスクにおいて,特徴相関層を著しく上回っている。
論文 参考訳(メタデータ) (2020-09-16T17:33:01Z) - Sparse Coding Driven Deep Decision Tree Ensembles for Nuclear
Segmentation in Digital Pathology Images [15.236873250912062]
デジタル病理画像セグメンテーションタスクにおいて、ディープニューラルネットワークと高い競争力を持つ、容易に訓練されながら強力な表現学習手法を提案する。
ScD2TEと略すこの手法はスパースコーディング駆動の深層決定木アンサンブルと呼ばれ、表現学習の新しい視点を提供する。
論文 参考訳(メタデータ) (2020-08-13T02:59:31Z) - Recursive Multi-model Complementary Deep Fusion forRobust Salient Object
Detection via Parallel Sub Networks [62.26677215668959]
完全畳み込みネットワークは、正体検出(SOD)分野において優れた性能を示している。
本稿では,全く異なるネットワークアーキテクチャを持つ並列サブネットワークからなる,より広いネットワークアーキテクチャを提案する。
いくつかの有名なベンチマークの実験では、提案されたより広範なフレームワークの優れた性能、優れた一般化、強力な学習能力が明らかに示されている。
論文 参考訳(メタデータ) (2020-08-07T10:39:11Z) - Boosting Connectivity in Retinal Vessel Segmentation via a Recursive
Semantics-Guided Network [23.936946593048987]
U字型ネットワークはセマンティクス誘導モジュールを導入して拡張され、拡張されたセマンティクス情報を浅い層に統合し、ネットワークがより強力な機能を探索できるようにする。
慎重に設計されたセマンティクス誘導ネットワークは、いくつかの公開データセットで広く評価されている。
論文 参考訳(メタデータ) (2020-04-24T09:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。