論文の概要: Removing supervision in semantic segmentation with local-global matching
and area balancing
- arxiv url: http://arxiv.org/abs/2303.17410v1
- Date: Thu, 30 Mar 2023 14:27:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 13:09:25.272624
- Title: Removing supervision in semantic segmentation with local-global matching
and area balancing
- Title(参考訳): 局所的言語マッチングと領域バランスによる意味的セグメンテーションの排除
- Authors: Simone Rossetti (1 and 2), Nico Sam\`a (1), Fiora Pirri (1 and 2) ((1)
DeepPlants, (2) Diag Sapienza)
- Abstract要約: 我々は,局所的なパッチマッチングを利用した新しいエンドツーエンドモデルを設計し,セマンティックセグメンテーションのためのカテゴリ,優れたローカライゼーション,領域,形状を予測する。
Weakly Supervised Semanticでは画像レベルのラベルが75% mIoU,PascalVOC2012 valセットが75%,MS-COCO2014 valセットが46%であった。
また、PascalVOC2012 val では 43.6% mIoU 、MS-COCO2014 val では 19.4% である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Removing supervision in semantic segmentation is still tricky. Current
approaches can deal with common categorical patterns yet resort to multi-stage
architectures. We design a novel end-to-end model leveraging local-global patch
matching to predict categories, good localization, area and shape of objects
for semantic segmentation. The local-global matching is, in turn, compelled by
optimal transport plans fulfilling area constraints nearing a solution for
exact shape prediction. Our model attains state-of-the-art in Weakly Supervised
Semantic Segmentation, only image-level labels, with 75% mIoU on PascalVOC2012
val set and 46% on MS-COCO2014 val set. Dropping the image-level labels and
clustering self-supervised learned features to yield pseudo-multi-level labels,
we obtain an unsupervised model for semantic segmentation. We also attain
state-of-the-art on Unsupervised Semantic Segmentation with 43.6% mIoU on
PascalVOC2012 val set and 19.4% on MS-COCO2014 val set. The code is available
at https://github.com/deepplants/PC2M.
- Abstract(参考訳): セマンティクスセグメンテーションにおける監督の削除はまだ難しい。
現在のアプローチは、多段階アーキテクチャを頼りにしながら、共通のカテゴリパターンを扱うことができる。
我々は,局所的なパッチマッチングを利用した新しいエンドツーエンドモデルを設計し,セマンティックセグメンテーションのためのカテゴリ,優れたローカライゼーション,領域,形状を予測する。
局所的グローバルマッチングは、厳密な形状予測の解に近い領域制約を満たす最適な輸送計画によって強制される。
Weakly Supervised Semantic Segmentationでは画像レベルのラベルのみで,PascalVOC2012 valでは75% mIoU,MS-COCO2014 valでは46%の精度で最先端のセマンティックセグメンテーションを実現している。
画像レベルラベルをドロップし、自己教師付き学習特徴をクラスタリングして擬似マルチレベルラベルを生成し、セマンティックセグメンテーションのための教師なしモデルを得る。
また,PascalVOC2012 val では 43.6% mIoU ,MS-COCO2014 val では 19.4% で,教師なしセマンティックセマンティックセマンティックセマンティックセマンティクスの最先端を達成できた。
コードはhttps://github.com/deepplants/PC2Mで入手できる。
関連論文リスト
- Unsupervised Universal Image Segmentation [59.0383635597103]
本稿では,Unsupervised Universal Model (U2Seg) を提案する。
U2Segは、自己教師付きモデルを利用して、これらのセグメンテーションタスクの擬似意味ラベルを生成する。
次に、これらの擬似意味ラベル上でモデルを自己学習し、かなりの性能向上をもたらす。
論文 参考訳(メタデータ) (2023-12-28T18:59:04Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - SemiVL: Semi-Supervised Semantic Segmentation with Vision-Language
Guidance [97.00445262074595]
半教師付きセマンティックセマンティックセグメンテーションに視覚言語モデルからの豊富な事前情報を統合することを提案する。
我々は、視覚と言語を共同で推論する言語誘導デコーダを設計する。
4つのセマンティックセグメンテーションデータセット上でSemiVLを評価する。
論文 参考訳(メタデータ) (2023-11-27T19:00:06Z) - Coupling Global Context and Local Contents for Weakly-Supervised
Semantic Segmentation [54.419401869108846]
Weakly Supervised Semantic (WSSS)モデルを提案する。
グローバルなオブジェクトコンテキストを異なる粒度空間でキャプチャするために,フレキシブルなコンテキストアグリゲーションモジュールを提案する。
局所的な細粒度を集約するために、ボトムアップパラメータ学習可能な方法で意味的に一貫した特徴融合モジュールを提案する。
論文 参考訳(メタデータ) (2023-04-18T15:29:23Z) - CAFS: Class Adaptive Framework for Semi-Supervised Semantic Segmentation [5.484296906525601]
半教師付きセマンティックセグメンテーションは、いくつかのラベル付きサンプルと多数のラベルなし画像を使用して、ピクセルを特定のクラスに分類するモデルを学ぶ。
半教師付きセマンティックセグメンテーション(CAFS)のためのクラス適応型セミスーパービジョンフレームワークを提案する。
CAFSはラベル付きデータセットに検証セットを構築し、各クラスの校正性能を活用する。
論文 参考訳(メタデータ) (2023-03-21T05:56:53Z) - Fully Self-Supervised Learning for Semantic Segmentation [46.6602159197283]
セマンティックセグメンテーション(FS4)のための完全自己教師型フレームワークを提案する。
自己スーパービジョンのためのグローバルなセマンティック知識をフル活用したセマンティックセマンティックセマンティクスのためのブートストラップ付きトレーニングスキームを提案する。
大規模COCO-Stuffデータセットを用いて本手法の評価を行い,対象物と対象物の両方において7.19mIoUの改善を実現した。
論文 参考訳(メタデータ) (2022-02-24T09:38:22Z) - Scaling up Multi-domain Semantic Segmentation with Sentence Embeddings [81.09026586111811]
ゼロショット設定に適用した場合、最先端の教師付き性能を実現するセマンティックセマンティックセマンティクスへのアプローチを提案する。
これは各クラスラベルを、クラスを記述する短い段落のベクトル値の埋め込みに置き換えることによって達成される。
結果として得られた200万以上の画像の統合セマンティックセグメンテーションデータセットは、7つのベンチマークデータセット上の最先端の教師付きメソッドと同等のパフォーマンスを達成するモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-04T07:19:09Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。