論文の概要: Fully Self-Supervised Learning for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2202.11981v1
- Date: Thu, 24 Feb 2022 09:38:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 16:54:17.602031
- Title: Fully Self-Supervised Learning for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのための完全自己教師付き学習
- Authors: Yuan Wang, Wei Zhuo, Yucong Li, Zhi Wang, Qi Ju, Wenwu Zhu
- Abstract要約: セマンティックセグメンテーション(FS4)のための完全自己教師型フレームワークを提案する。
自己スーパービジョンのためのグローバルなセマンティック知識をフル活用したセマンティックセマンティックセマンティクスのためのブートストラップ付きトレーニングスキームを提案する。
大規模COCO-Stuffデータセットを用いて本手法の評価を行い,対象物と対象物の両方において7.19mIoUの改善を実現した。
- 参考スコア(独自算出の注目度): 46.6602159197283
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present a fully self-supervised framework for semantic
segmentation(FS^4). A fully bootstrapped strategy for semantic segmentation,
which saves efforts for the huge amount of annotation, is crucial for building
customized models from end-to-end for open-world domains. This application is
eagerly needed in realistic scenarios. Even though recent self-supervised
semantic segmentation methods have gained great progress, these works however
heavily depend on the fully-supervised pretrained model and make it impossible
a fully self-supervised pipeline. To solve this problem, we proposed a
bootstrapped training scheme for semantic segmentation, which fully leveraged
the global semantic knowledge for self-supervision with our proposed PGG
strategy and CAE module. In particular, we perform pixel clustering and
assignments for segmentation supervision. Preventing it from clustering a mess,
we proposed 1) a pyramid-global-guided (PGG) training strategy to supervise the
learning with pyramid image/patch-level pseudo labels, which are generated by
grouping the unsupervised features. The stable global and pyramid semantic
pseudo labels can prevent the segmentation from learning too many clutter
regions or degrading to one background region; 2) in addition, we proposed
context-aware embedding (CAE) module to generate global feature embedding in
view of its neighbors close both in space and appearance in a non-trivial way.
We evaluate our method on the large-scale COCO-Stuff dataset and achieved 7.19
mIoU improvements on both things and stuff objects
- Abstract(参考訳): 本研究では,セマンティックセグメンテーション(FS^4)のための完全自己教師型フレームワークを提案する。
大量のアノテーションの労力を省くセマンティックセグメンテーションのための完全なブートストラップ戦略は、オープンワールドドメインのエンドツーエンドからカスタマイズされたモデルを構築するのに不可欠である。
このアプリケーションは現実的なシナリオでは熱心に必要です。
最近の自己教師付きセマンティクスセグメンテーション法は大きな進歩を遂げているが、これらの作業は完全な教師付き事前学習モデルに大きく依存しており、完全な自己教師付きパイプラインは不可能である。
この問題を解決するために,提案したPGG戦略とCAEモジュールを用いて,グローバルなセマンティック知識を自己スーパービジョンに活用したセマンティックセマンティックセマンティクスのためのブートストラップトレーニング手法を提案する。
特に,セグメンテーションの監督のために画素クラスタリングと割り当てを行う。
混ざり合うのを防ぐために 提案しました
1) ピラミッド画像・パッチレベルの擬似ラベルを用いて, 教師なし特徴をグループ化して学習を指導する。
安定なグローバルおよびピラミッドのセマンティックな擬似ラベルは、セグメンテーションが乱雑な領域を学習したり、1つのバックグラウンド領域に分解することを防ぐことができる。
2) 文脈認識埋め込み (cae) モジュールを提案し, 近接空間と非自明な方法での出現の両方を視野に, グローバルな特徴埋め込みを生成する。
大規模COCO-Stuffデータセットを用いて本手法の評価を行い,対象物と対象物の両方において7.19mIoUの改善を実現した。
関連論文リスト
- Enhancing Weakly Supervised Semantic Segmentation with Multi-modal Foundation Models: An End-to-End Approach [7.012760526318993]
Weakly-Supervised Semantic (WSSS)は、広範囲なラベリングに対してコスト効率のよい回避手段を提供する。
既存のWSSSメソッドは、セグメンテーション結果の低さにつながるオブジェクトの境界を理解するのに苦労しています。
本稿では,境界ボックス内の視覚的基盤モデルを活用することにより,これらの問題に対処する,新しい効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-10T16:42:25Z) - SOHES: Self-supervised Open-world Hierarchical Entity Segmentation [82.45303116125021]
この研究は、人間のアノテーションを必要としない新しいアプローチであるSOHES(Self-supervised Open World Hierarchical Entities)を提示する。
視覚的特徴クラスタリングにより高品質な擬似ラベルを生成し,教師同士の学習によって擬似ラベルの雑音を補正する。
学習データとして生画像を用いることにより,自己監督型オープンワールドセグメンテーションにおける前例のない性能を実現する。
論文 参考訳(メタデータ) (2024-04-18T17:59:46Z) - OMH: Structured Sparsity via Optimally Matched Hierarchy for Unsupervised Semantic Segmentation [69.37484603556307]
Un Semantic segmenting (USS)は、事前に定義されたラベルに頼ることなく、イメージをセグメント化する。
上記の問題を同時に解決するために,OMH (Optimally Matched Hierarchy) という新しいアプローチを導入する。
我々のOMHは既存のUSS法と比較して教師なしセグメンテーション性能がよい。
論文 参考訳(メタデータ) (2024-03-11T09:46:41Z) - Unsupervised Universal Image Segmentation [59.0383635597103]
本稿では,Unsupervised Universal Model (U2Seg) を提案する。
U2Segは、自己教師付きモデルを利用して、これらのセグメンテーションタスクの擬似意味ラベルを生成する。
次に、これらの擬似意味ラベル上でモデルを自己学習し、かなりの性能向上をもたらす。
論文 参考訳(メタデータ) (2023-12-28T18:59:04Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - Global and Local Features through Gaussian Mixture Models on Image
Semantic Segmentation [0.38073142980732994]
本稿では,前者をサポートするグローバル表現を抽出しながら特徴表現の内部構造を提案する。
トレーニング中、データからガウス混合モデルを予測し、スキップ接続と復号ステージにマージすることで、誤った帰納バイアスを回避する。
この結果から,クラスタリングの動作を学習表現(言語とローカル)と組み合わせることで,セマンティックセマンティックセマンティクスを向上できることが示唆された。
論文 参考訳(メタデータ) (2022-07-19T10:10:49Z) - TransFGU: A Top-down Approach to Fine-Grained Unsupervised Semantic
Segmentation [44.75300205362518]
教師なしセマンティックセグメンテーションは、手動のアノテーションを使わずに、低レベルの視覚的特徴の高レベルセマンティック表現を得ることを目的としている。
本稿では, 非常に複雑なシナリオにおける細粒度セグメンテーションのための, トップダウンの教師なしセグメンテーションフレームワークを提案する。
我々の結果は、トップダウンの教師なしセグメンテーションが、オブジェクト中心とシーン中心の両方のデータセットに対して堅牢であることを示している。
論文 参考訳(メタデータ) (2021-12-02T18:59:03Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - Labels4Free: Unsupervised Segmentation using StyleGAN [40.39780497423365]
本稿では,StyleGAN生成オブジェクトに対する教師なしセグメンテーションフレームワークを提案する。
最先端の教師付きセグメンテーションネットワークに対する比較結果について報告する。
論文 参考訳(メタデータ) (2021-03-27T18:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。