論文の概要: Denoised Non-Local Neural Network for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2110.14200v1
- Date: Wed, 27 Oct 2021 06:16:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 14:26:05.893455
- Title: Denoised Non-Local Neural Network for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのためのDenoized Non-Local Neural Network
- Authors: Qi Song, Jie Li, Hao Guo, Rui Huang
- Abstract要約: クラス間ノイズとクラス内ノイズをそれぞれ除去するデノナイズド非ローカネットワーク(デノナイズドNL)を提案する。
提案したNLは,都市景観における83.5%,46.69% mIoU,ADE20Kの最先端性能を達成できる。
- 参考スコア(独自算出の注目度): 18.84185406522064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The non-local network has become a widely used technique for semantic
segmentation, which computes an attention map to measure the relationships of
each pixel pair. However, most of the current popular non-local models tend to
ignore the phenomenon that the calculated attention map appears to be very
noisy, containing inter-class and intra-class inconsistencies, which lowers the
accuracy and reliability of the non-local methods. In this paper, we
figuratively denote these inconsistencies as attention noises and explore the
solutions to denoise them. Specifically, we inventively propose a Denoised
Non-Local Network (Denoised NL), which consists of two primary modules, i.e.,
the Global Rectifying (GR) block and the Local Retention (LR) block, to
eliminate the inter-class and intra-class noises respectively. First, GR adopts
the class-level predictions to capture a binary map to distinguish whether the
selected two pixels belong to the same category. Second, LR captures the
ignored local dependencies and further uses them to rectify the unwanted
hollows in the attention map. The experimental results on two challenging
semantic segmentation datasets demonstrate the superior performance of our
model. Without any external training data, our proposed Denoised NL can achieve
the state-of-the-art performance of 83.5\% and 46.69\% mIoU on Cityscapes and
ADE20K, respectively.
- Abstract(参考訳): 非ローカルネットワークは、各ピクセルペアの関係を測定するためにアテンションマップを計算するセマンティックセグメンテーションの手法として広く使われている。
しかし、現在の一般的な非局所モデルの多くは、計算された注意マップが非常に騒がしいように見える現象を無視しがちであり、クラス間およびクラス内不整合を含み、非局所メソッドの正確性と信頼性が低下する。
本稿では,これらの不整合を注意ノイズとして表現し,その解法を探究する。
具体的には、クラス間およびクラス内ノイズを除去するために、Global Rectifying(GR)ブロックとLocal Retention(LR)ブロックという2つの主要モジュールからなるDenoized Non-Local Network(Denoized NL)を提案する。
まず、GRはクラスレベルの予測を採用してバイナリマップをキャプチャし、選択された2つのピクセルが同じカテゴリに属するかどうかを識別する。
第2に、LRは無視されたローカル依存関係をキャプチャし、注意マップ内の不要な空洞を修正するためにそれらを使用する。
2つの難解なセマンティクスセグメンテーションデータセットの実験結果は,モデルの優れた性能を示している。
外部トレーニングデータがないため,提案したDenoized NLは,都市景観における83.5\%,46.69\% mIoU,ADE20Kをそれぞれ達成できる。
関連論文リスト
- Improving Weakly-Supervised Object Localization Using Adversarial Erasing and Pseudo Label [7.400926717561454]
本稿では,弱教師付きオブジェクトローカライゼーションの枠組みについて検討する。
それは、画像と画像レベルのクラスラベルのみを使用して、オブジェクトクラスとその位置を予測できるニューラルネットワークをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2024-04-15T06:02:09Z) - Learning Enriched Features via Selective State Spaces Model for Efficient Image Deblurring [0.0]
Image Deblurringは、高品質な画像を、それに対応するぼやけた画像から復元することを目的としている。
本稿では、選択状態空間モデルを利用して、リッチで正確な特徴を集約する効率的な画像デブロアリングネットワークを提案する。
実験により,提案手法は広く用いられているベンチマークにおいて,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-29T10:40:41Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - Learning Confident Classifiers in the Presence of Label Noise [5.829762367794509]
本稿では,ノイズ観測のための確率論的モデルを提案し,信頼性の高い分類とセグメンテーションモデルの構築を可能にする。
実験により,本アルゴリズムは,検討された分類問題と分割問題に対して,最先端の解よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-02T04:27:25Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - DMN4: Few-shot Learning via Discriminative Mutual Nearest Neighbor
Neural Network [40.18613107849442]
少ないショット学習は、低データレギュレーション下でのイメージの分類を目的としている。
近年の業績は深層ディスクリプタを用いて有望なパフォーマンスを達成している。
各タスクに最も関連するクエリ記述子を明示的に選択するために、MNN(Mutual Nearest Neighbor)関係を提案します。
論文 参考訳(メタデータ) (2021-03-15T06:57:09Z) - Region-based Non-local Operation for Video Classification [11.746833714322154]
本稿では,地域別非局所的(RNL)操作を自己注意機構のファミリーとして提案する。
チャネルアテンションモジュールと提案したRNLを組み合わせることで,市販のCNNに組み込んだアテンションチェーンを設計し,エンドツーエンドのトレーニングを行う。
提案手法の実験結果は,他の注意機構よりも優れており,Something V1データセット上での最先端性能を実現している。
論文 参考訳(メタデータ) (2020-07-17T14:57:05Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。