論文の概要: ARM: A Confidence-Based Adversarial Reweighting Module for Coarse
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2009.05205v2
- Date: Sat, 24 Jul 2021 04:53:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 21:23:29.130903
- Title: ARM: A Confidence-Based Adversarial Reweighting Module for Coarse
Semantic Segmentation
- Title(参考訳): ARM: 厳密なセマンティックセグメンテーションのための信頼に基づく逆方向再重み付けモジュール
- Authors: Jingchao Liu, Ye Du, Zehua Fu, Qingjie Liu, Yunhong Wang
- Abstract要約: 本稿では,既存の粗いアノテーションを活用するための信頼度に基づく再重み付け手法を提案する。
我々は、この戦略をARM(Adversarial Reweighting Module)に一般化し、その収束を厳密に証明する。
ARMは粗いラベルの都市景観のmIoUを大幅に改善し、ADE20KデータセットのmIoUを47.50に増やした。
- 参考スコア(独自算出の注目度): 43.49913914787921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coarsely-labeled semantic segmentation annotations are easy to obtain, but
therefore bear the risk of losing edge details and introducing background
pixels. Impeded by the inherent noise, existing coarse annotations are only
taken as a bonus for model pre-training. In this paper, we try to exploit their
potentials with a confidence-based reweighting strategy. To expand, loss-based
reweighting strategies usually take the high loss value to identify two
completely different types of pixels, namely, valuable pixels in noise-free
annotations and mislabeled pixels in noisy annotations. This makes it
impossible to perform two tasks of mining valuable pixels and suppressing
mislabeled pixels at the same time. However, with the help of the prediction
confidence, we successfully solve this dilemma and simultaneously perform two
subtasks with a single reweighting strategy. Furthermore, we generalize this
strategy into an Adversarial Reweighting Module (ARM) and prove its convergence
strictly. Experiments on standard datasets shows our ARM can bring consistent
improvements for both coarse annotations and fine annotations. Specifically,
built on top of DeepLabv3+, ARM improves the mIoU on the coarsely-labeled
Cityscapes by a considerable margin and increases the mIoU on the ADE20K
dataset to 47.50.
- Abstract(参考訳): 粗くラベルされた意味セグメンテーションアノテーションは簡単に得られるが、エッジの詳細を失い、背景ピクセルを導入するリスクがある。
固有のノイズの影響を受け、既存の粗いアノテーションはモデル事前トレーニングのボーナスとしてのみ扱われる。
本稿では,信頼度に基づく再重み付け戦略を用いて,その可能性を活用する。
損失に基づく再重み付け戦略は、通常、ノイズのないアノテーションにおける価値あるピクセルとノイズの多いアノテーションにおける誤ラベルされたピクセルの2つの全く異なるタイプのピクセルを特定するために、高い損失値を取る。
これにより、貴重なピクセルのマイニングと誤ったラベルのピクセルの抑制という2つのタスクを同時に行うことが不可能になる。
しかし、予測信頼性の助けを借りて、このジレンマを解き、同時に2つのサブタスクを1つの再重み付け戦略で実行した。
さらに,この戦略をARM(Adversarial Reweighting Module)に一般化し,その収束性を厳密に証明する。
標準データセットの実験は、ARMが粗いアノテーションと細かいアノテーションの両方に一貫した改善をもたらすことを示している。
具体的には、DeepLabv3+上に構築されたARMは、粗いラベルの都市景観のmIoUを大幅に改善し、ADE20KデータセットのmIoUを47.50に増やした。
関連論文リスト
- Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.325956390997]
本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文 参考訳(メタデータ) (2024-10-14T10:44:47Z) - Image-level Regression for Uncertainty-aware Retinal Image Segmentation [3.7141182051230914]
我々は,新たな不確実性認識変換(SAUNA)を導入する。
以上の結果から,SAUNA変換の統合とセグメント化損失は,異なるセグメンテーションモデルにおいて大きな性能向上をもたらすことが示唆された。
論文 参考訳(メタデータ) (2024-05-27T04:17:10Z) - 2D Feature Distillation for Weakly- and Semi-Supervised 3D Semantic
Segmentation [92.17700318483745]
合成訓練された2Dセマンティックセマンティックセグメンテーションネットワークから高レベル特徴情報を蒸留するアイデアに基づく画像誘導ネットワーク(IGNet)を提案する。
IGNetは、ScribbleKITTI上の弱い教師付きLiDARセマンティックセマンティックセグメンテーションの最先端の結果を達成し、8%のラベル付きポイントしか持たない完全な教師付きトレーニングに対して最大98%のパフォーマンスを誇っている。
論文 参考訳(メタデータ) (2023-11-27T07:57:29Z) - The Treasure Beneath Multiple Annotations: An Uncertainty-aware Edge
Detector [70.43599299422813]
既存のメソッドは、単純な投票プロセスを使用して複数のアノテーションを融合し、エッジ固有の曖昧さを無視し、アノテータのラベル付けバイアスを無視する。
多様なアノテーションの主観性とあいまいさを調査するために不確実性を利用した新しい不確実性認識エッジ検出器(UAED)を提案する。
UAEDは複数のエッジ検出ベンチマークで一貫したパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-03-21T13:14:36Z) - Modeling Multimodal Aleatoric Uncertainty in Segmentation with Mixture
of Stochastic Expert [24.216869988183092]
入力画像にあいまいさが存在する場合、セグメンテーションにおけるデータ独立不確実性(いわゆるアレタリック不確実性)を捉えることに重点を置いている。
本稿では,各専門家ネットワークがアレータティック不確実性の異なるモードを推定する,新しい専門家モデル(MoSE)を提案する。
We developed a Wasserstein-like loss that makes direct minimizes the distribution distance between the MoSE and ground truth annotations。
論文 参考訳(メタデータ) (2022-12-14T16:48:21Z) - Enhancing Privacy against Inversion Attacks in Federated Learning by
using Mixing Gradients Strategies [0.31498833540989407]
フェデレーション学習は情報漏洩のリスクを低減するが、攻撃に対して脆弱である。
いくつかのニューラルネットワーク設計決定が、勾配逆攻撃に対してどのように防御できるかを示す。
これらの戦略は、画像認識のためのLeNETのような深層畳み込みニューラルネットワークにも有用である。
論文 参考訳(メタデータ) (2022-04-26T12:08:28Z) - Weakly Supervised Semantic Segmentation by Pixel-to-Prototype Contrast [43.40192909920495]
クロスビュー特徴のセマンティック一貫性とイントラ(インター)クラスのコンパクト性(分散)について検討した。
本稿では,2つの新しい画素対プロトタイプのコントラスト正規化用語を提案する。
我々の手法は、ベースネットワークを変更することなく、既存のWSSSモデルにシームレスに組み込むことができる。
論文 参考訳(メタデータ) (2021-10-14T01:44:57Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - Patch-wise++ Perturbation for Adversarial Targeted Attacks [132.58673733817838]
トランスファビリティの高い対比例の作成を目的としたパッチワイズ反復法(PIM)を提案する。
具体的には、各イテレーションのステップサイズに増幅係数を導入し、$epsilon$-constraintをオーバーフローする1ピクセルの全体的な勾配が、その周辺領域に適切に割り当てられる。
現在の攻撃方法と比較して、防御モデルでは35.9%、通常訓練されたモデルでは32.7%、成功率を大幅に向上させた。
論文 参考訳(メタデータ) (2020-12-31T08:40:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。