論文の概要: RecurSeed and EdgePredictMix: Pseudo-Label Refinement Learning for
Weakly Supervised Semantic Segmentation across Single- and Multi-Stage
Frameworks
- arxiv url: http://arxiv.org/abs/2204.06754v4
- Date: Fri, 15 Dec 2023 20:47:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 21:27:21.932317
- Title: RecurSeed and EdgePredictMix: Pseudo-Label Refinement Learning for
Weakly Supervised Semantic Segmentation across Single- and Multi-Stage
Frameworks
- Title(参考訳): recurseed と edgepredictmix: シングルステージとマルチステージフレームワーク間の弱い教師付きセマンティックセグメンテーションのための擬似ラベルリファインメント学習
- Authors: Sanghyun Jo, In-Jae Yu, Kyungsu Kim
- Abstract要約: イメージレベルラベル(WSSS-IL)のみを用いた弱い教師付きセマンティックセマンティックセマンティックセマンティクスは、潜在的に有用である。
しかし、パフォーマンスと実装の複雑さは依然としてアプリケーションを制限する。
本稿では,非検出と偽検出を交互に削減するRecurSeedを提案する。
また、オブジェクトのエッジをさらに表現するEdgePredictMixと呼ばれる新しいデータ拡張(DA)アプローチを提案する。
- 参考スコア(独自算出の注目度): 3.3240906432768482
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Although weakly supervised semantic segmentation using only image-level
labels (WSSS-IL) is potentially useful, its low performance and implementation
complexity still limit its application. The main causes are (a) non-detection
and (b) false-detection phenomena: (a) The class activation maps refined from
existing WSSS-IL methods still only represent partial regions for large-scale
objects, and (b) for small-scale objects, over-activation causes them to
deviate from the object edges. We propose RecurSeed, which alternately reduces
non- and false detections through recursive iterations, thereby implicitly
finding an optimal junction that minimizes both errors. We also propose a novel
data augmentation (DA) approach called EdgePredictMix, which further expresses
an object's edge by utilizing the probability difference information between
adjacent pixels in combining the segmentation results, thereby compensating for
the shortcomings when applying the existing DA methods to WSSS. We achieved new
state-of-the-art performances on both the PASCAL VOC 2012 and MS COCO 2014
benchmarks (VOC val: 74.4%, COCO val: 46.4%). The code is available at
https://github.com/shjo-april/RecurSeed_and_EdgePredictMix.
- Abstract(参考訳): 画像レベルラベル(wsss-il)のみを用いた、弱い教師付きセマンティックセグメンテーションは潜在的に有用であるが、その低パフォーマンスと実装の複雑さはアプリケーションを制限する。
主な原因は
(a)非検出、及び
(b)誤検出現象
(a) 既存のWSSS-ILメソッドから洗練されているクラスアクティベーションマップは、いまだに大規模オブジェクトの部分領域のみを表すものであり、
(b)小規模オブジェクトの場合、過剰なアクティベーションはオブジェクトエッジから外れる原因となる。
本稿では,再帰的反復による非誤検出を交互に削減し,両方の誤りを最小化する最適ジャンクションを暗黙的に見つけるRecurSeedを提案する。
また,既存DA手法をWSSSに適用する際の欠点を補うために,隣接画素間の確率差情報を利用してオブジェクトのエッジを更に表現する,EdgePredictMixと呼ばれる新しいデータ拡張(DA)手法を提案する。
PASCAL VOC 2012とMS COCO 2014ベンチマーク(VOC val:74.4%、COCO val:46.4%)で、最先端のパフォーマンスを新たに達成しました。
コードはhttps://github.com/shjo-april/RecurSeed_and_EdgePredictMixで公開されている。
関連論文リスト
- Learning to Detour: Shortcut Mitigating Augmentation for Weakly Supervised Semantic Segmentation [7.5856806269316825]
弱いラベルを用いた弱教師付きセマンティックセグメンテーション(WSSS)は,画素レベルのラベルを取得するためのアノテーションコストを軽減するために活発に研究されている。
本稿では,WSSS のためのショートカット緩和機能 (SMA) を提案する。これは,トレーニングデータに見られないオブジェクトと背景の組み合わせの合成表現を生成し,ショートカット機能の使用を減らす。
論文 参考訳(メタデータ) (2024-05-28T13:07:35Z) - PDiscoNet: Semantically consistent part discovery for fine-grained
recognition [62.12602920807109]
画像レベルのクラスラベルのみを用いて,対象部品の発見を推奨する先行情報とともにPDiscoNetを提案する。
CUB,CelebA,PartImageNet で得られた結果から,提案手法は従来手法よりもかなり優れた部分発見性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-09-06T17:19:29Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds [16.6833745997519]
弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、画像レベルのラベルだけでセマンティクスモデルをトレーニングするという約束により、最近注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されたグローバルしきい値決定方式である,という分析的および実証的な証拠を提供する。
論文 参考訳(メタデータ) (2022-03-30T04:26:14Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - Anti-aliasing Semantic Reconstruction for Few-Shot Semantic Segmentation [66.85202434812942]
セグメンテーションを意味的再構成問題として再検討する。
基本クラスの特徴を,新しいクラス再構築のためのクラスレベルのセマンティック空間にまたがる一連の基底ベクトルに変換する。
提案手法はアンチエイリアス・セマンティック・リストラクション (ASR) と呼ばれ, 数発の学習問題に対して, 体系的かつ解釈可能な解法を提供する。
論文 参考訳(メタデータ) (2021-06-01T02:17:36Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - CAFENet: Class-Agnostic Few-Shot Edge Detection Network [19.01453512012934]
我々は、数発のセマンティックエッジ検出と呼ばれる、新しい数発の学習課題に取り組む。
また,メタ学習戦略に基づくクラス非依存Few-shot Edge Detection Network (CAFENet)を提案する。
論文 参考訳(メタデータ) (2020-03-18T14:18:59Z) - Frustratingly Simple Few-Shot Object Detection [98.42824677627581]
希少なクラスにおける既存検出器の最後の層のみを微調整することは、数発の物体検出タスクに不可欠である。
このような単純なアプローチは、現在のベンチマークで約220ポイントのメタ学習方法より優れている。
論文 参考訳(メタデータ) (2020-03-16T00:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。