論文の概要: MetaSeg: Content-Aware Meta-Net for Omni-Supervised Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2401.11738v1
- Date: Mon, 22 Jan 2024 07:31:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 15:00:45.911982
- Title: MetaSeg: Content-Aware Meta-Net for Omni-Supervised Semantic
Segmentation
- Title(参考訳): MetaSeg: Omni-Supervised Semantic Segmentationのためのコンテンツ対応メタネット
- Authors: Shenwang Jiang, Jianan Li, Ying Wang, Wenxuan Wu, Jizhou Zhang, Bo
Huang, Tingfa Xu
- Abstract要約: 弱いオブジェクトレベルのアノテーションから生成された擬似セグメンテーションラベルに必然的に存在するノイズラベル。
メタラーニングの最近の進歩に触発されて、クリーンラベルの背後に隠されたノイズを受動的に許容するのに苦労するのではなく、より実用的な解決策は、ノイズの多い領域を積極的に見つけることである、と私たちは主張する。
本稿では,任意のセグメンテーションモデルに対応するノイズインジケータとして,CAM-Netを主成分とするメタ学習に基づくセグメンテーション手法MetaSegを提案する。
- 参考スコア(独自算出の注目度): 17.59676962334776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy labels, inevitably existing in pseudo segmentation labels generated
from weak object-level annotations, severely hampers model optimization for
semantic segmentation. Previous works often rely on massive hand-crafted losses
and carefully-tuned hyper-parameters to resist noise, suffering poor
generalization capability and high model complexity. Inspired by recent
advances in meta learning, we argue that rather than struggling to tolerate
noise hidden behind clean labels passively, a more feasible solution would be
to find out the noisy regions actively, so as to simply ignore them during
model optimization. With this in mind, this work presents a novel meta learning
based semantic segmentation method, MetaSeg, that comprises a primary
content-aware meta-net (CAM-Net) to sever as a noise indicator for an arbitrary
segmentation model counterpart. Specifically, CAM-Net learns to generate
pixel-wise weights to suppress noisy regions with incorrect pseudo labels while
highlighting clean ones by exploiting hybrid strengthened features from image
content, providing straightforward and reliable guidance for optimizing the
segmentation model. Moreover, to break the barrier of time-consuming training
when applying meta learning to common large segmentation models, we further
present a new decoupled training strategy that optimizes different model layers
in a divide-and-conquer manner. Extensive experiments on object, medical,
remote sensing and human segmentation shows that our method achieves superior
performance, approaching that of fully supervised settings, which paves a new
promising way for omni-supervised semantic segmentation.
- Abstract(参考訳): 弱いオブジェクトレベルのアノテーションから生成される疑似セグメンテーションラベルに必然的に存在するノイズラベルは、セマンティックセグメンテーションのためのモデル最適化をひどく阻害する。
従来は手作りの大規模な損失と、ノイズに耐えるために慎重に調整されたハイパーパラメータに頼っていた。
メタ学習の最近の進歩に触発されて、クリーンラベルの背後に隠れたノイズをパッシブに許容することに苦しむのではなく、より実現可能な解決策は、モデル最適化中にそれらを単純に無視するために、ノイズ領域を積極的に見つけ出すことである。
そこで本研究では,任意のセグメンテーションモデルのノイズインジケータとして使用する一次コンテンツ認識メタネット(cam-net)を含む,新しいメタ学習に基づく意味セグメンテーション手法であるmetasegを提案する。
具体的には、CAM-Netは、画像コンテンツからハイブリッド強化された特徴を活用してクリーンな画像を強調しながら、誤った擬似ラベルを持つノイズ領域を抑えるために画素ワイドの重みを生成することを学び、セグメント化モデルを最適化するための単純で信頼性の高いガイダンスを提供する。
さらに,一般的な大規模セグメンテーションモデルにメタ学習を適用する際の時間消費型トレーニングの障壁を破るために,異なるモデルレイヤを分割・結合方式で最適化する新しい分離型トレーニング戦略を提案する。
対象, 医療, リモートセンシング, 人体セグメンテーションに関する大規模な実験により, 本手法は, 完全に教師付きされたセグメンテーションに近づき, オムニ教師付きセグメンテーションの新たな有望な方法を示す。
関連論文リスト
- Precision matters: Precision-aware ensemble for weakly supervised semantic segmentation [14.931551206723041]
Weakly Supervised Semantic (WSSS) は、画像レベルのラベルなどの弱い監督を、セグメンテーションモデルをトレーニングするために採用している。
我々はWSSSに適した高度なアンサンブルアプローチであるORANDNetを提案する。
論文 参考訳(メタデータ) (2024-06-28T03:58:02Z) - SmooSeg: Smoothness Prior for Unsupervised Semantic Segmentation [27.367986520072147]
教師なしセマンティックセグメンテーションは、手動のアノテーションなしでイメージをセマンティックグループに分割する難しいタスクである。
本研究では,SmooSegという手法を提案する。SmooSegは,観察中の近接性関係をスムーズな信号としてモデル化する自己教師付き学習手法である。
SmooSegは3つのデータセットのピクセル精度でSTEGOを著しく上回っている。
論文 参考訳(メタデータ) (2023-10-27T03:29:25Z) - MixReorg: Cross-Modal Mixed Patch Reorganization is a Good Mask Learner
for Open-World Semantic Segmentation [110.09800389100599]
セマンティックセグメンテーションのための新鮮で簡単な事前学習パラダイムであるMixReorgを提案する。
我々のアプローチは、パッチとテキストの対応を保ちながら、画像パッチを混合することで、きめ細かいパッチテキストペアデータを生成することである。
マスク学習者としてMixReorgを使用することで、従来のテキスト教師付きセマンティックセマンティックセマンティックモデルは、非常に一般化可能なピクセル・セマンティックアライメントを実現することができる。
論文 参考訳(メタデータ) (2023-08-09T09:35:16Z) - Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models [47.03411822627386]
我々は,mIoUとmIoUの精度の異なる指標を最小化する,いくつかの問題固有の新規攻撃を提案する。
驚くべきことに、セマンティックセグメンテーションモデルに対する既存の敵の訓練の試みは、弱かったり、全く損なわれなかったりする。
最近提案された堅牢なImageNetバックボーンを用いて,PASCAL-VOCとADE20kの最大6倍のトレーニング時間を持つ,対向的に堅牢なセマンティックセマンティックセマンティクスモデルを得ることができることを示す。
論文 参考訳(メタデータ) (2023-06-22T14:56:06Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - Incremental Learning in Semantic Segmentation from Image Labels [18.404068463921426]
既存のセマンティックセグメンテーションアプローチは印象的な結果を得るが、新しいカテゴリが発見されるにつれてモデルを漸進的に更新することは困難である。
本稿では、安価で広く利用可能な画像レベルのラベルから新しいクラスを分類することを目的とした、Weakly Incremental Learning for Semanticsのための新しいフレームワークを提案する。
擬似ラベルをオフラインで生成する既存のアプローチとは対照的に、画像レベルのラベルで訓練され、セグメンテーションモデルで正規化される補助分類器を使用して、擬似スーパービジョンをオンラインで取得し、モデルを漸進的に更新する。
論文 参考訳(メタデータ) (2021-12-03T12:47:12Z) - Half-Real Half-Fake Distillation for Class-Incremental Semantic
Segmentation [84.1985497426083]
畳み込みニューラルネットワークは漸進的な学習に不適である。
新しいクラスは利用できるが、初期トレーニングデータは保持されない。
訓練されたセグメンテーションネットワークを「反転」して、ランダムノイズから始まる入力画像の合成を試みる。
論文 参考訳(メタデータ) (2021-04-02T03:47:16Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。