論文の概要: Guided Collaborative Training for Pixel-wise Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2008.05258v1
- Date: Wed, 12 Aug 2020 12:08:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 05:01:51.398173
- Title: Guided Collaborative Training for Pixel-wise Semi-Supervised Learning
- Title(参考訳): ピクセル単位半教師付き学習のための指導的協調学習
- Authors: Zhanghan Ke, Di Qiu, Kaican Li, Qiong Yan, Rynson W.H. Lau
- Abstract要約: 画素ワイドタスクのためのGCT(Guid Collaborative Training)を提案する。
GCTは、新しい欠陥検出器を通じて高密度出力に起因する問題に対処する。
その結果、GCTは、構造的適応を伴わずに、幅広い画素単位のタスクに適用できる。
- 参考スコア(独自算出の注目度): 38.749729584102724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate the generalization of semi-supervised learning (SSL) to
diverse pixel-wise tasks. Although SSL methods have achieved impressive results
in image classification, the performances of applying them to pixel-wise tasks
are unsatisfactory due to their need for dense outputs. In addition, existing
pixel-wise SSL approaches are only suitable for certain tasks as they usually
require to use task-specific properties. In this paper, we present a new SSL
framework, named Guided Collaborative Training (GCT), for pixel-wise tasks,
with two main technical contributions. First, GCT addresses the issues caused
by the dense outputs through a novel flaw detector. Second, the modules in GCT
learn from unlabeled data collaboratively through two newly proposed
constraints that are independent of task-specific properties. As a result, GCT
can be applied to a wide range of pixel-wise tasks without structural
adaptation. Our extensive experiments on four challenging vision tasks,
including semantic segmentation, real image denoising, portrait image matting,
and night image enhancement, show that GCT outperforms state-of-the-art SSL
methods by a large margin. Our code available at:
https://github.com/ZHKKKe/PixelSSL.
- Abstract(参考訳): 本稿では,半教師付き学習(SSL)の多彩なピクセルワイドタスクへの一般化について検討する。
SSL法は画像分類において顕著な結果を得たが,高密度出力を必要とするため,画素単位のタスクに適用する性能は不十分である。
さらに、既存のpixel-wise sslアプローチは、タスク固有のプロパティを使用する必要がある特定のタスクにのみ適合する。
本稿では,pixel-wiseタスクのための新しいsslフレームワークであるguided collaborative training(gct)について述べる。
まず、GCTは新たな欠陥検出器を通じて高密度出力に起因する問題に対処する。
第2に、GCTのモジュールは、タスク固有のプロパティに依存しない2つの新しい制約を通じて、ラベルのないデータから協調的に学習する。
その結果、GCTは、構造的適応を伴わずに、幅広い画素単位のタスクに適用できる。
セマンティックセグメンテーション, 実像デノイング, ポートレート画像マッチング, 夜間画像強調を含む4つの難解な視覚課題に対する広範な実験により, GCTは最先端のSSL手法よりも大きなマージンで優れていることが示された。
私たちのコードは、https://github.com/ZHKKe/PixelSSL.comで利用可能です。
関連論文リスト
- Towards Open-Vocabulary Semantic Segmentation Without Semantic Labels [53.8817160001038]
画素レベルの理解にCLIP画像エンコーダを適用する新しい手法であるPixelCLIPを提案する。
セマンティックラベルを使わずにマスクを活用するという課題に対処するため,オンラインクラスタリングアルゴリズムを考案した。
PixelCLIPはCLIPよりも大幅にパフォーマンスが向上し、キャプション管理手法に比べて競合性が向上した。
論文 参考訳(メタデータ) (2024-09-30T01:13:03Z) - CamoTeacher: Dual-Rotation Consistency Learning for Semi-Supervised Camouflaged Object Detection [58.07124777351955]
本稿では,Dual-Rotation Consistency Learning(DRCL)を利用した新しい半教師付きCODフレームワークであるCamoTeacherを紹介する。
DRCLは、画素レベルとインスタンスレベルの回転ビューの一貫性を活用することで、擬似ラベルノイズを最小化する。
私たちのコードはまもなく利用可能になります。
論文 参考訳(メタデータ) (2024-08-15T09:33:43Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images [12.961686610789416]
自己教師付き学習(SSL)は、スライドイメージ全体のアノテーションオーバーヘッドを低減する代替ソリューションとして登場した。
これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限するマルチレゾリューションWSIを扱うために設計されていない。
マルチ解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
論文 参考訳(メタデータ) (2023-03-20T10:57:28Z) - Consistency Regularisation in Varying Contexts and Feature Perturbations
for Semi-Supervised Semantic Segmentation of Histology Images [14.005379068469361]
この課題を軽減するために,一貫性に基づく半教師付き学習(SSL)アプローチを提案する。
SSLモデルは、コンテキストの変更や、限られたトレーニングデータのために一般化が不十分な特徴の摂動にも影響する可能性がある。
相互整合性トレーニングにより、エンコーダの特徴が異なる摂動に不変となり、予測信頼性が向上することを示す。
論文 参考訳(メタデータ) (2023-01-30T18:21:57Z) - IDEAL: Improved DEnse locAL Contrastive Learning for Semi-Supervised
Medical Image Segmentation [3.6748639131154315]
我々は,メートル法学習の概念をセグメンテーションタスクに拡張する。
本稿では,高密度画素レベルの特徴量を得るための単純な畳み込みプロジェクションヘッドを提案する。
下流タスクに対して,2ストリーム正規化トレーニングを含む双方向正規化機構を考案した。
論文 参考訳(メタデータ) (2022-10-26T23:11:02Z) - Object discovery and representation networks [78.16003886427885]
本研究では,事前に符号化された構造を自ら発見する自己教師型学習パラダイムを提案する。
Odinはオブジェクト発見と表現ネットワークを結合して意味のある画像のセグメンテーションを発見する。
論文 参考訳(メタデータ) (2022-03-16T17:42:55Z) - Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised
Visual Representation Learning [60.75687261314962]
我々は,高密度な特徴表現を学習するための画素レベルのプレテキストタスクを導入する。
ピクセル・ツー・プロパゲーション整合性タスクは、最先端のアプローチよりも優れた結果をもたらす。
結果は、ピクセルレベルでプリテキストタスクを定義する強力な可能性を示している。
論文 参考訳(メタデータ) (2020-11-19T18:59:45Z) - Semi-supervised Medical Image Segmentation through Dual-task Consistency [18.18484640332254]
本稿では,画素単位のセグメンテーションマップと,ターゲットの幾何認識レベルセット表現を共同で予測する,新しいデュアルタスクディープネットワークを提案する。
本手法はラベルなしデータを組み込むことで性能を大幅に向上させることができる。
当フレームワークは,最先端の半教師付き医用画像分割法より優れている。
論文 参考訳(メタデータ) (2020-09-09T17:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。