論文の概要: Self-Supervised Learning for Image Segmentation: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2505.13584v1
- Date: Mon, 19 May 2025 17:47:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.462204
- Title: Self-Supervised Learning for Image Segmentation: A Comprehensive Survey
- Title(参考訳): イメージセグメンテーションのための自己監督型学習:総合的な調査
- Authors: Thangarajah Akilan, Nusrat Jahan, Wandong Zhang,
- Abstract要約: 自己教師付き学習(SSL)は、いくつかの実用的な下流コンピュータビジョン問題を解決するための強力な機械学習(ML)パラダイムとなっている。
この調査は、最近の150以上のイメージセグメンテーション記事、特にSSLについて徹底的に調査している。
これは、プリテキストタスク、ダウンストリームタスク、イメージセグメンテーション研究によく使われるベンチマークデータセットの実用的な分類を提供する。
- 参考スコア(独自算出の注目度): 8.139668811376822
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Supervised learning demands large amounts of precisely annotated data to achieve promising results. Such data curation is labor-intensive and imposes significant overhead regarding time and costs. Self-supervised learning (SSL) partially overcomes these limitations by exploiting vast amounts of unlabeled data and creating surrogate (pretext or proxy) tasks to learn useful representations without manual labeling. As a result, SSL has become a powerful machine learning (ML) paradigm for solving several practical downstream computer vision problems, such as classification, detection, and segmentation. Image segmentation is the cornerstone of many high-level visual perception applications, including medical imaging, intelligent transportation, agriculture, and surveillance. Although there is substantial research potential for developing advanced algorithms for SSL-based semantic segmentation, a comprehensive study of existing methodologies is essential to trace advances and guide emerging researchers. This survey thoroughly investigates over 150 recent image segmentation articles, particularly focusing on SSL. It provides a practical categorization of pretext tasks, downstream tasks, and commonly used benchmark datasets for image segmentation research. It concludes with key observations distilled from a large body of literature and offers future directions to make this research field more accessible and comprehensible for readers.
- Abstract(参考訳): 教師付き学習は、有望な結果を得るために、大量の正確な注釈付きデータを要求する。
このようなデータキュレーションは労働集約的であり、時間とコストに関してかなりのオーバーヘッドを課している。
自己教師付き学習(SSL)は、大量のラベルのないデータを利用して、手動ラベリングなしで有用な表現を学習するための代理(テキストまたはプロキシ)タスクを作成することで、これらの制限を部分的に克服する。
その結果、SSLは分類、検出、セグメンテーションといったいくつかの実用的な下流コンピュータビジョン問題を解決するための強力な機械学習(ML)パラダイムとなった。
画像セグメンテーションは、医療画像、インテリジェントトランスポート、農業、監視など、多くの高度な視覚認識アプリケーションの基礎となっている。
SSLに基づくセマンティックセグメンテーションのための高度なアルゴリズムを開発するには、かなりの研究可能性があるが、既存の方法論の包括的な研究は、先進的な研究者の追跡とガイドに不可欠である。
この調査は、最近の150以上のイメージセグメンテーション記事、特にSSLについて徹底的に調査している。
これは、プリテキストタスク、ダウンストリームタスク、イメージセグメンテーション研究によく使われるベンチマークデータセットの実用的な分類を提供する。
この研究は、大量の文献から抽出された重要な観察によって締めくくられ、この研究分野をよりアクセスしやすく、読者にとって理解しやすいものにするための将来の方向性を提供する。
関連論文リスト
- A Survey of the Self Supervised Learning Mechanisms for Vision Transformers [5.152455218955949]
視覚タスクにおける自己教師あり学習(SSL)の適用は注目されている。
SSL手法を体系的に分類する包括的分類法を開発した。
SSLの背後にあるモチベーションについて議論し、人気のある事前トレーニングタスクをレビューし、この分野の課題と進歩を強調します。
論文 参考訳(メタデータ) (2024-08-30T07:38:28Z) - Semi-Supervised Semantic Segmentation Based on Pseudo-Labels: A Survey [49.47197748663787]
本総説は, 半教師付きセマンティックセグメンテーション分野における擬似ラベル手法に関する最新の研究成果について, 包括的かつ組織的に概観することを目的としている。
さらに,医用およびリモートセンシング画像のセグメンテーションにおける擬似ラベル技術の適用について検討する。
論文 参考訳(メタデータ) (2024-03-04T10:18:38Z) - Weakly-Supervised Semantic Segmentation with Image-Level Labels: from Traditional Models to Foundation Models [28.518514106150413]
弱教師付きセマンティックセマンティックセグメンテーション(WSSS)はピクセルレベルのラベルを避ける効果的なソリューションである。
私たちは、WSSSの最も難しい形態であるイメージレベルのラベルによるWSSSに焦点を当てています。
本稿では,WSSS の文脈において,Segment Anything Model (SAM) などの視覚基盤モデルの適用性について検討する。
論文 参考訳(メタデータ) (2023-10-19T07:16:54Z) - Object discovery and representation networks [78.16003886427885]
本研究では,事前に符号化された構造を自ら発見する自己教師型学習パラダイムを提案する。
Odinはオブジェクト発見と表現ネットワークを結合して意味のある画像のセグメンテーションを発見する。
論文 参考訳(メタデータ) (2022-03-16T17:42:55Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - Self-supervised on Graphs: Contrastive, Generative,or Predictive [25.679620842010422]
SSL(Self-supervised Learning)は、よく設計されたプリテキストタスクを通じて有益な知識を抽出するための新しいパラダイムとして登場しています。
既存のグラフSSLメソッドは、コントラスト、生成、予測の3つのカテゴリに分けられる。
また、一般的なデータセット、評価メトリクス、下流タスク、さまざまなアルゴリズムのオープンソース実装をまとめています。
論文 参考訳(メタデータ) (2021-05-16T03:30:03Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Towards Robust Partially Supervised Multi-Structure Medical Image
Segmentation on Small-Scale Data [123.03252888189546]
データ不足下における部分教師付き学習(PSL)における方法論的ギャップを埋めるために,不確実性下でのビシナルラベル(VLUU)を提案する。
マルチタスク学習とヴィジナルリスク最小化によって動機づけられたVLUUは、ビジナルラベルを生成することによって、部分的に教師付き問題を完全な教師付き問題に変換する。
本研究は,ラベル効率の高い深層学習における新たな研究の方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-11-28T16:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。