論文の概要: Self-Supervised Vision Transformers Are Efficient Segmentation Learners
for Imperfect Labels
- arxiv url: http://arxiv.org/abs/2401.12535v1
- Date: Tue, 23 Jan 2024 07:24:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 16:31:14.496332
- Title: Self-Supervised Vision Transformers Are Efficient Segmentation Learners
for Imperfect Labels
- Title(参考訳): 自己教師付き視覚トランスフォーマーは不完全ラベルのための効率的なセグメンテーション学習者である
- Authors: Seungho Lee, Seoungyoon Kang, Hyunjung Shim
- Abstract要約: 本研究では,自己教師型視覚変換器(SSVT)を用いたセマンティックセグメンテーションの費用対効果を示す。
SSVTバックボーンを凍結し,軽量セグメンテーションヘッドを訓練することにより,不完全ラベルを効果的に活用し,不完全ラベルの堅牢性を向上させる。
- 参考スコア(独自算出の注目度): 19.921140174384096
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This study demonstrates a cost-effective approach to semantic segmentation
using self-supervised vision transformers (SSVT). By freezing the SSVT backbone
and training a lightweight segmentation head, our approach effectively utilizes
imperfect labels, thereby improving robustness to label imperfections.
Empirical experiments show significant performance improvements over existing
methods for various annotation types, including scribble, point-level, and
image-level labels. The research highlights the effectiveness of
self-supervised vision transformers in dealing with imperfect labels, providing
a practical and efficient solution for semantic segmentation while reducing
annotation costs. Through extensive experiments, we confirm that our method
outperforms baseline models for all types of imperfect labels. Especially under
the zero-shot vision-language-model-based label, our model exhibits 11.5\%p
performance gain compared to the baseline.
- Abstract(参考訳): 本研究では,自己教師付き視覚変換器(SSVT)を用いたセマンティックセグメンテーションの費用対効果を示す。
SSVTバックボーンを凍結し,軽量セグメンテーションヘッドを訓練することにより,不完全ラベルを効果的に活用し,不完全ラベルの堅牢性を向上させる。
経験的な実験では、scribble、point-level、image-level labelなど、さまざまなアノテーションタイプに対する既存のメソッドのパフォーマンスが大幅に向上している。
本研究は,非完全ラベル処理における自己教師型視覚変換器の有効性を強調し,アノテーションコストを低減しつつセマンティックセグメンテーションの実践的で効率的なソリューションを提供する。
実験により,提案手法は全ての不完全ラベルのベースラインモデルよりも優れていることを確認した。
特にゼロショットビジョン言語モデルに基づくラベルでは,ベースラインと比較して11.5\%pの性能向上を示す。
関連論文リスト
- Vision-language Assisted Attribute Learning [53.60196963381315]
大規模な属性ラベリングは通常不完全で部分的である。
既存の属性学習手法は、欠落したラベルを否定的な扱いをすることが多い。
利用可能な視覚言語知識を活用して、モデル学習の強化に欠落しているラベルを明確に明らかにする。
論文 参考訳(メタデータ) (2023-12-12T06:45:19Z) - Robust Feature Learning Against Noisy Labels [0.2082426271304908]
ミスラベルされたサンプルはモデルの一般化を著しく低下させることができる。
ノイズラベルによる監督の負の影響を最小限に抑えるために、プログレッシブな自己ブートストラッピングが導入される。
実験結果から,本手法は強騒音ラベル下でモデルロバスト性を効果的かつ効果的に向上できることが示唆された。
論文 参考訳(メタデータ) (2023-07-10T02:55:35Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Incremental Learning in Semantic Segmentation from Image Labels [18.404068463921426]
既存のセマンティックセグメンテーションアプローチは印象的な結果を得るが、新しいカテゴリが発見されるにつれてモデルを漸進的に更新することは困難である。
本稿では、安価で広く利用可能な画像レベルのラベルから新しいクラスを分類することを目的とした、Weakly Incremental Learning for Semanticsのための新しいフレームワークを提案する。
擬似ラベルをオフラインで生成する既存のアプローチとは対照的に、画像レベルのラベルで訓練され、セグメンテーションモデルで正規化される補助分類器を使用して、擬似スーパービジョンをオンラインで取得し、モデルを漸進的に更新する。
論文 参考訳(メタデータ) (2021-12-03T12:47:12Z) - Learning with Noisy Labels by Efficient Transition Matrix Estimation to
Combat Label Miscorrection [3.48062110627933]
ノイズラベルを用いた学習に関する最近の研究は、小さなクリーンデータセットを利用して顕著な性能を示した。
モデルメタラーニングに基づくラベル補正手法は, ハエの雑音ラベルを補正することにより, さらなる性能向上を図っている。
しかし、ラベルの誤りに対する保護は存在せず、性能劣化は避けられない。
本研究では,ラベル遷移行列を高速に学習する頑健で効率的な手法を提案する。
論文 参考訳(メタデータ) (2021-11-29T20:12:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。