論文の概要: Active Label Correction for Semantic Segmentation with Foundation Models
- arxiv url: http://arxiv.org/abs/2403.10820v2
- Date: Tue, 4 Jun 2024 13:15:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 12:28:47.799292
- Title: Active Label Correction for Semantic Segmentation with Foundation Models
- Title(参考訳): 基礎モデルを用いたセマンティックセグメンテーションのための能動ラベル補正
- Authors: Hoyoung Kim, Sehyun Hwang, Suha Kwak, Jungseul Ok,
- Abstract要約: 本稿では,画素の擬似ラベルを補正する補正クエリの設計に基づく,アクティブラベル補正(ALC)の有効なフレームワークを提案する。
提案手法は, (i) 擬似ラベルを用いた補正クエリのアノテータフレンドリな設計, (ii) スーパーピクセルに基づくラベル展開を先取りする取得関数の2つの重要な手法からなる。
PASCAL,Cityscapes,Kvasir-SEGデータセットの実験結果から,ALCフレームワークの有効性が示された。
- 参考スコア(独自算出の注目度): 34.0733215363568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training and validating models for semantic segmentation require datasets with pixel-wise annotations, which are notoriously labor-intensive. Although useful priors such as foundation models or crowdsourced datasets are available, they are error-prone. We hence propose an effective framework of active label correction (ALC) based on a design of correction query to rectify pseudo labels of pixels, which in turn is more annotator-friendly than the standard one inquiring to classify a pixel directly according to our theoretical analysis and user study. Specifically, leveraging foundation models providing useful zero-shot predictions on pseudo labels and superpixels, our method comprises two key techniques: (i) an annotator-friendly design of correction query with the pseudo labels, and (ii) an acquisition function looking ahead label expansions based on the superpixels. Experimental results on PASCAL, Cityscapes, and Kvasir-SEG datasets demonstrate the effectiveness of our ALC framework, outperforming prior methods for active semantic segmentation and label correction. Notably, utilizing our method, we obtained a revised dataset of PASCAL by rectifying errors in 2.6 million pixels in PASCAL dataset.
- Abstract(参考訳): セマンティックセグメンテーションのためのモデルのトレーニングと検証には、ピクセル単位のアノテーションを持つデータセットが必要である。
ファンデーションモデルやクラウドソースデータセットなどの有用な事前情報は利用可能だが、エラーが発生しやすい。
そこで我々は,画素の擬似ラベルを補正するための補正クエリの設計に基づいて,能動的ラベル補正(ALC)の有効なフレームワークを提案する。
具体的には、擬似ラベルとスーパーピクセルに有用なゼロショット予測を提供する基礎モデルを活用し、本手法は2つの重要な手法からなる。
一 擬似ラベルによる訂正クエリの注釈に親しみやすい設計、及び
(ii)スーパーピクセルに基づくラベル展開を目指す取得関数。
PASCAL,Cityscapes,Kvasir-SEGデータセットによる実験結果から,ALCフレームワークの有効性が示された。
特に,本手法を用いて,PASCALデータセット中の260万画素の誤りを補正し,PASCALの修正データセットを得た。
関連論文リスト
- HPL-ESS: Hybrid Pseudo-Labeling for Unsupervised Event-based Semantic Segmentation [47.271784693700845]
本稿では,教師なしイベントベースセマンティックセマンティックセグメンテーション(HPL-ESS)のためのハイブリッド擬似ラベルフレームワークを提案する。
提案手法は,DSEC-Semanticデータセットにおいて,既存の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2024-03-25T14:02:33Z) - Semantic Connectivity-Driven Pseudo-labeling for Cross-domain
Segmentation [89.41179071022121]
自己学習はドメイン間セマンティックセグメンテーションにおいて一般的なアプローチである。
本稿ではセマンティック・コネクティビティ駆動の擬似ラベル方式を提案する。
このアプローチは、接続レベルにおいて擬似ラベルを定式化し、構造的および低雑音のセマンティクスの学習を容易にする。
論文 参考訳(メタデータ) (2023-12-11T12:29:51Z) - Top-K Pooling with Patch Contrastive Learning for Weakly-Supervised
Semantic Segmentation [25.628382644404066]
パッチコントラスト学習(TKP-PCL)を用いたトップKプーリングという新しいViTベースのWSSS手法を提案する。
また,パッチ埋め込みを向上し,最終的な結果を改善するパッチコントラッシブエラー (PCE) も提案されている。
当社のアプローチは非常に効率的で、PASCAL 2012データセットの他の最先端のWSSSメソッドよりも優れています。
論文 参考訳(メタデータ) (2023-10-15T13:19:59Z) - Estimating label quality and errors in semantic segmentation data via
any model [19.84626033109009]
ラベル品質を評価する手法について検討し、最も低いスコアのイメージを正しくラベル付けする可能性が低いことを示す。
これにより、高品質なトレーニング/評価データセットを保証するために、レビューするデータを優先順位付けすることが可能になる。
論文 参考訳(メタデータ) (2023-07-11T07:29:09Z) - Distilling Self-Supervised Vision Transformers for Weakly-Supervised
Few-Shot Classification & Segmentation [58.03255076119459]
視覚変換器(ViT)を利用した弱教師付き小ショット画像分類とセグメンテーションの課題に対処する。
提案手法は,自己監督型ViTからトークン表現を抽出し,その相関関係を利用して分類とセグメンテーションの予測を行う。
Pascal-5iとCOCO-20iの実験は、様々な監視設定において大きなパフォーマンス向上を示した。
論文 参考訳(メタデータ) (2023-07-07T06:16:43Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - CAFS: Class Adaptive Framework for Semi-Supervised Semantic Segmentation [5.484296906525601]
半教師付きセマンティックセグメンテーションは、いくつかのラベル付きサンプルと多数のラベルなし画像を使用して、ピクセルを特定のクラスに分類するモデルを学ぶ。
半教師付きセマンティックセグメンテーション(CAFS)のためのクラス適応型セミスーパービジョンフレームワークを提案する。
CAFSはラベル付きデータセットに検証セットを構築し、各クラスの校正性能を活用する。
論文 参考訳(メタデータ) (2023-03-21T05:56:53Z) - Dense FixMatch: a simple semi-supervised learning method for pixel-wise
prediction tasks [68.36996813591425]
Dense FixMatchは,高密度かつ構造化された予測タスクのオンライン半教師付き学習のための簡易な手法である。
我々は、擬似ラベルにマッチング操作を追加することにより、画像分類を超えた半教師付き学習問題にFixMatchの適用を可能にする。
Dense FixMatchは、ラベル付きデータのみを使用して教師付き学習と比較すると、結果を著しく改善し、ラベル付きサンプルの1/4でそのパフォーマンスに近づいた。
論文 参考訳(メタデータ) (2022-10-18T15:02:51Z) - Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。
CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文 参考訳(メタデータ) (2021-12-17T18:59:41Z) - LabOR: Labeling Only if Required for Domain Adaptive Semantic
Segmentation [79.96052264984469]
本稿では,UDAモデルが不確実な点に対して,少ないラベルを適応的に付与する手法を提案する。
作業コストを最小化しつつ、ドメイン適応型セマンティックセマンティックセマンティクスのための新しいフレームワークの利点を示す。
論文 参考訳(メタデータ) (2021-08-12T07:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。