論文の概要: More Than Meets The Eye: Semi-supervised Learning Under Non-IID Data
- arxiv url: http://arxiv.org/abs/2104.10223v1
- Date: Tue, 20 Apr 2021 19:51:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-23 02:12:07.364672
- Title: More Than Meets The Eye: Semi-supervised Learning Under Non-IID Data
- Title(参考訳): 非IIDデータによる半教師あり学習
- Authors: Saul Calderon-Ramirez and Luis Oala
- Abstract要約: また,最先端のSSDLアルゴリズムの性能を劣化させることも可能であることを示した。
非IID-SSDLと呼ばれる包括的なシミュレーションサンドボックスをSSDLアルゴリズムのストレステストのために提示し、利用可能にします。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A common heuristic in semi-supervised deep learning (SSDL) is to select
unlabelled data based on a notion of semantic similarity to the labelled data.
For example, labelled images of numbers should be paired with unlabelled images
of numbers instead of, say, unlabelled images of cars. We refer to this
practice as semantic data set matching. In this work, we demonstrate the limits
of semantic data set matching. We show that it can sometimes even degrade the
performance for a state of the art SSDL algorithm. We present and make
available a comprehensive simulation sandbox, called non-IID-SSDL, for stress
testing an SSDL algorithm under different degrees of distribution mismatch
between the labelled and unlabelled data sets. In addition, we demonstrate that
simple density based dissimilarity measures in the feature space of a generic
classifier offer a promising and more reliable quantitative matching criterion
to select unlabelled data before SSDL training.
- Abstract(参考訳): 半教師付きディープラーニング(SSDL)における一般的なヒューリスティックは、ラベル付きデータとのセマンティックな類似性の概念に基づいて、非ラベル付きデータを選択することである。
例えば、数字のラベル付き画像は、例えば車のラベル付き画像ではなく、数字のラベル付き画像と組み合わせるべきである。
私たちはこのプラクティスをセマンティックデータセットマッチングと呼んでいる。
本研究では,セマンティックデータセットマッチングの限界を示す。
また,最先端のSSDLアルゴリズムの性能を劣化させることも可能であることを示した。
本研究では,ラベル付きデータセットとラベルなしデータセットの分布ミスマッチの程度が異なるssdlアルゴリズムをストレステストするために,非iid-ssdlと呼ばれる総合的なシミュレーションサンドボックスを提案する。
さらに,一般分類器の特徴空間における単純密度に基づく異種性尺度は,ssdl訓練前にラベルなしデータを選択するための有望で信頼性の高い量的マッチング基準を提供することを示す。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Generalized Semi-Supervised Learning via Self-Supervised Feature Adaptation [87.17768598044427]
従来の半教師付き学習は、ラベル付きデータとラベルなしデータの特徴分布が一貫したものであると仮定する。
本稿では,ラベル付きおよびラベルなしデータの分散によるSSL性能向上のための汎用フレームワークであるセルフ・スーパービジョン・フィーチャー・アダプテーション(SSFA)を提案する。
提案するSSFAは擬似ラベルベースのSSL学習者に適用可能であり,ラベル付き,ラベルなし,さらには目に見えない分布における性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-05-31T03:13:45Z) - Prompt-based Pseudo-labeling Strategy for Sample-Efficient Semi-Supervised Extractive Summarization [12.582774521907227]
半教師付き学習(SSL)は、ラベル付きデータが不足し、ラベルなしデータが豊富であるシナリオで広く使われているテクニックである。
標準SSLメソッドは、まず分類モデルをトレーニングし、次に分類器の信頼性値を使用して擬似ラベルを選択するために教師-学生パラダイムに従う。
より正確な擬似ラベルでラベルなしのサンプルを抽出するLLMを用いたプロンプトベースの擬似ラベル方式を提案する。
論文 参考訳(メタデータ) (2023-11-16T04:29:41Z) - Learning Semi-supervised Gaussian Mixture Models for Generalized
Category Discovery [36.01459228175808]
本稿では,表現学習とクラス数推定を交互に行うEMライクなフレームワークを提案する。
汎用画像分類データセットと細粒度オブジェクト認識データセットの双方について,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-05-10T13:47:38Z) - AuxMix: Semi-Supervised Learning with Unconstrained Unlabeled Data [6.633920993895286]
我々は,現在最先端のSSLアルゴリズムが,ラベルなし補助データの存在下での性能低下に悩まされていることを示す。
ラベル付き集合にセマンティックに似ていない補助データを隠すために,自己教師付き学習タスクを活用して汎用的な特徴を学習するアルゴリズムであるAuxMixを提案する。
論文 参考訳(メタデータ) (2022-06-14T16:25:20Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - Re-distributing Biased Pseudo Labels for Semi-supervised Semantic
Segmentation: A Baseline Investigation [30.688753736660725]
疑似ラベルを生成するために,DARS法とDARS法を提案する。
我々の手法は最先端の手法と比較して好適に機能する。
論文 参考訳(メタデータ) (2021-07-23T14:45:14Z) - GuidedMix-Net: Learning to Improve Pseudo Masks Using Labeled Images as
Reference [153.354332374204]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
まず、ラベル付きデータとラベルなしデータの間に特徴アライメントの目的を導入し、類似した画像対をキャプチャする。
MITransは、ラベルなしデータのさらなるプログレッシブな精細化のための強力な知識モジュールであることが示されている。
ラベル付きデータに対する教師付き学習とともに、ラベル付きデータの予測が生成した擬似マスクとともに学習される。
論文 参考訳(メタデータ) (2021-06-29T02:48:45Z) - PseudoSeg: Designing Pseudo Labels for Semantic Segmentation [78.35515004654553]
ラベルなしまたは弱いラベル付きデータを用いたトレーニングのための構造化された擬似ラベルを生成するための擬似ラベルの再設計を提案する。
提案手法の有効性を,低データと高データの両方において示す。
論文 参考訳(メタデータ) (2020-10-19T17:59:30Z) - Unsupervised Semantic Aggregation and Deformable Template Matching for
Semi-Supervised Learning [34.560447389853614]
ラベルなしデータのセマンティックラベルを生成するために,T-MI損失に基づく教師なしセマンティックアグリゲーションを提案する。
ラベル付きサンプルを格納する機能プールは動的に更新され、ラベルなしデータのプロキシラベルが割り当てられる。
実験と解析により、USADTMが最高性能を達成することを確認した。
論文 参考訳(メタデータ) (2020-10-12T08:17:56Z) - ATSO: Asynchronous Teacher-Student Optimization for Semi-Supervised
Medical Image Segmentation [99.90263375737362]
教師-学生最適化の非同期版であるATSOを提案する。
ATSOはラベルのないデータを2つのサブセットに分割し、モデルの微調整に1つのサブセットを交互に使用し、他のサブセットのラベルを更新する。
医用画像のセグメンテーションデータセットを2つ評価し,様々な半教師付き環境において優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-24T04:05:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。