論文の概要: Masked Supervised Learning for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2210.00923v1
- Date: Mon, 3 Oct 2022 13:30:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 15:50:56.728250
- Title: Masked Supervised Learning for Semantic Segmentation
- Title(参考訳): 意味セグメンテーションのためのマスク教師付き学習
- Authors: H. Zunair and A. Ben Hamza
- Abstract要約: Masked Supervised Learning (MaskSup)は、短いコンテキストと長距離コンテキストの両方をモデル化する効果的なシングルステージ学習パラダイムである。
提案手法は計算効率が良く,平均交叉和(mIoU)において10%向上することを示す。
- 参考スコア(独自算出の注目度): 5.177947445379688
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-attention is of vital importance in semantic segmentation as it enables
modeling of long-range context, which translates into improved performance. We
argue that it is equally important to model short-range context, especially to
tackle cases where not only the regions of interest are small and ambiguous,
but also when there exists an imbalance between the semantic classes. To this
end, we propose Masked Supervised Learning (MaskSup), an effective single-stage
learning paradigm that models both short- and long-range context, capturing the
contextual relationships between pixels via random masking. Experimental
results demonstrate the competitive performance of MaskSup against strong
baselines in both binary and multi-class segmentation tasks on three standard
benchmark datasets, particularly at handling ambiguous regions and retaining
better segmentation of minority classes with no added inference cost. In
addition to segmenting target regions even when large portions of the input are
masked, MaskSup is also generic and can be easily integrated into a variety of
semantic segmentation methods. We also show that the proposed method is
computationally efficient, yielding an improved performance by 10\% on the mean
intersection-over-union (mIoU) while requiring $3\times$ less learnable
parameters.
- Abstract(参考訳): セマンティックセグメンテーションでは、長期コンテキストのモデリングを可能にするため、自己注意が重要であり、パフォーマンスが向上する。
特に、関心領域が小さくあいまいな場合だけでなく、セマンティッククラスの間に不均衡が存在する場合にも対処するためには、ショートレンジコンテキストをモデル化することが等しく重要であると論じる。
そこで,提案するmasksup(masked supervised learning)は,ランダムマスキングによってピクセル間の文脈関係をキャプチャし,短距離と長距離のコンテキストをモデル化する,効果的な単段階学習パラダイムである。
実験の結果,3つのベンチマークデータセットにおいて,特にあいまいな領域の処理や,推論コストを増すことなくマイノリティクラスのセグメンテーションを良好に保ちながら,バイナリおよびマルチクラスセグメンテーションタスクにおけるmasksupの強力なベースラインに対する競合性能が示された。
入力の大部分がマスクされている場合でも、ターゲット領域のセグメンテーションに加えて、MaskSupは汎用的で、様々なセグメンテーション手法に容易に統合できる。
また,提案手法は計算効率が良く,平均交点オーバー結合 (miou) において10\%向上し,学習可能なパラメータを3\times$低減できることを示した。
関連論文リスト
- Customizing Segmentation Foundation Model via Prompt Learning for Instance Segmentation [7.6136466242670435]
Segment Anything Model (SAM)は、画像セグメンテーションタスクの一般化性と柔軟性の顕著な進歩で際立っている。
そこで本研究では,SAMに適応した即時学習によるインスタンスセグメンテーションをカスタマイズする手法を提案する。
提案手法は,ユーザ意図に合うように入力プロンプトを埋め込み空間に調整するプロンプト学習モジュール (PLM) を備える。
論文 参考訳(メタデータ) (2024-03-14T09:13:51Z) - Synthetic Instance Segmentation from Semantic Image Segmentation Masks [37.54211062233899]
合成インスタンスセグメンテーション(SISeg)と呼ばれる新しいパラダイムを提案する。
SISegはセマンティックやインスタンスセグメンテーションモデルをトレーニングする必要はなく、インスタンスレベルのイメージアノテーションを必要としない。
最先端の完全教師付きインスタンスセグメンテーション手法と比較して、競合的な結果が得られる。
論文 参考訳(メタデータ) (2023-08-02T05:13:02Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - Discovering Object Masks with Transformers for Unsupervised Semantic
Segmentation [75.00151934315967]
MaskDistillは教師なしセマンティックセグメンテーションのための新しいフレームワークである。
我々のフレームワークは、低レベルの画像キューにラッチを付けず、オブジェクト中心のデータセットに限らない。
論文 参考訳(メタデータ) (2022-06-13T17:59:43Z) - Per-Pixel Classification is Not All You Need for Semantic Segmentation [184.2905747595058]
マスク分類はセマンティックレベルのセグメンテーションタスクとインスタンスレベルのセグメンテーションタスクの両方を解くのに十分一般的である。
マスクの集合を予測する単純なマスク分類モデルであるMaskFormerを提案する。
提案手法は,現在の最先端セマンティック(ADE20Kでは55.6 mIoU)とパノプティックセグメンテーション(COCOでは52.7 PQ)モデルの両方に優れる。
論文 参考訳(メタデータ) (2021-07-13T17:59:50Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - A Three-Stage Self-Training Framework for Semi-Supervised Semantic
Segmentation [0.9786690381850356]
本稿では,セマンティックセグメンテーションのための3段階の自己学習フレームワークとして,包括的解を提案する。
本手法の鍵となる考え方は擬似マスク統計情報の抽出である。
次に、一貫性を強制するマルチタスクモデルを用いて擬似マスクの不確実性を減少させる。
論文 参考訳(メタデータ) (2020-12-01T21:00:27Z) - Commonality-Parsing Network across Shape and Appearance for Partially
Supervised Instance Segmentation [71.59275788106622]
そこで本稿では,マスク付分類から新しい分類へ一般化可能な,クラス非依存の共通性について考察する。
本モデルでは,COCOデータセット上のサンプルセグメンテーションにおける部分教師付き設定と少数ショット設定の両方において,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-24T07:23:44Z) - Lookahead Adversarial Learning for Near Real-Time Semantic Segmentation [2.538209532048867]
我々は,最先端セグメンテーションモデル(DeepLabv3+)をコアとした条件付き対向ネットワークを構築した。
我々は、ほぼリアルタイムなフィールドアプリケーションのための推論で高速に実行されるセグメンテーションモデルに焦点を当てる。
論文 参考訳(メタデータ) (2020-06-19T17:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。