論文の概要: Selective Pseudo-Labeling with Reinforcement Learning for
Semi-Supervised Domain Adaptation
- arxiv url: http://arxiv.org/abs/2012.03438v1
- Date: Mon, 7 Dec 2020 03:37:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:25:02.296683
- Title: Selective Pseudo-Labeling with Reinforcement Learning for
Semi-Supervised Domain Adaptation
- Title(参考訳): 半教師付きドメイン適応のための強化学習を用いた選択的擬似ラベル
- Authors: Bingyu Liu, Yuhong Guo, Jieping Ye, Weihong Deng
- Abstract要約: 半教師付きドメイン適応のための強化学習に基づく選択擬似ラベル法を提案する。
高精度かつ代表的な擬似ラベルインスタンスを選択するための深層Q-ラーニングモデルを開発する。
提案手法は, SSDAのベンチマークデータセットを用いて評価し, 全ての比較手法よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 116.48885692054724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent domain adaptation methods have demonstrated impressive improvement on
unsupervised domain adaptation problems. However, in the semi-supervised domain
adaptation (SSDA) setting where the target domain has a few labeled instances
available, these methods can fail to improve performance. Inspired by the
effectiveness of pseudo-labels in domain adaptation, we propose a reinforcement
learning based selective pseudo-labeling method for semi-supervised domain
adaptation. It is difficult for conventional pseudo-labeling methods to balance
the correctness and representativeness of pseudo-labeled data. To address this
limitation, we develop a deep Q-learning model to select both accurate and
representative pseudo-labeled instances. Moreover, motivated by large margin
loss's capacity on learning discriminative features with little data, we
further propose a novel target margin loss for our base model training to
improve its discriminability. Our proposed method is evaluated on several
benchmark datasets for SSDA, and demonstrates superior performance to all the
comparison methods.
- Abstract(参考訳): 最近の領域適応法は、教師なし領域適応問題において顕著に改善されている。
しかし、ターゲットドメインがいくつかのラベル付きインスタンスを利用できる半教師付きドメイン適応(SSDA)環境では、これらのメソッドは性能を向上できない可能性がある。
ドメイン適応における擬似ラベルの有効性に着想を得て,半教師付きドメイン適応のための強化学習に基づく選択的擬似ラベル法を提案する。
従来の擬似ラベル方式では,疑似ラベルデータの正しさと代表性のバランスをとることが困難である。
この制限に対処するため,我々は疑似ラベル付きインスタンスを正確に選択する深層Q-ラーニングモデルを開発した。
さらに,データの少ない識別的特徴の学習における大きなマージン損失の能力に動機付けられ,その識別性を向上させるために,ベースモデルトレーニングのための新たなターゲットマージン損失を提案する。
提案手法は, SSDAのベンチマークデータセットを用いて評価し, 全ての比較手法よりも優れた性能を示す。
関連論文リスト
- Dual-Decoupling Learning and Metric-Adaptive Thresholding for Semi-Supervised Multi-Label Learning [81.83013974171364]
半教師付きマルチラベル学習(SSMLL)は、正確なマルチラベルアノテーションを収集するコストを削減するために、ラベルのないデータを活用する強力なフレームワークである。
半教師付き学習とは異なり、インスタンスに含まれる複数のセマンティクスのため、SSMLLの擬似ラベルとして最も確率の高いラベルを選択することはできない。
本稿では,高品質な擬似ラベルを生成するための二重パースペクティブ手法を提案する。
論文 参考訳(メタデータ) (2024-07-26T09:33:53Z) - Unsupervised Domain Adaptation for Semantic Segmentation with Pseudo
Label Self-Refinement [9.69089112870202]
擬似ラベルのオンライン精錬のための補助的擬似ラベル精錬ネットワーク(PRN)を提案する。
3つの異なるドメインシフトを持つベンチマークデータセットに対する我々のアプローチを評価する。
論文 参考訳(メタデータ) (2023-10-25T20:31:07Z) - Bi-discriminator Domain Adversarial Neural Networks with Class-Level
Gradient Alignment [87.8301166955305]
そこで本研究では,クラスレベルのアライメントアライメントを有するバイディミネータドメイン対向ニューラルネットワークを提案する。
BACGは、領域分布の整合性を改善するために勾配信号と二階確率推定を利用する。
さらに、対照的な学習にインスパイアされ、トレーニングプロセスを大幅に短縮できるメモリバンクベースの変種であるFast-BACGを開発した。
論文 参考訳(メタデータ) (2023-10-21T09:53:17Z) - Labeling Where Adapting Fails: Cross-Domain Semantic Segmentation with
Point Supervision via Active Selection [81.703478548177]
セマンティックセグメンテーションに特化したトレーニングモデルは、大量のピクセル単位のアノテートデータを必要とする。
教師なしドメイン適応手法は、ラベル付きソースとラベルなしターゲットデータとの間の特徴分布の整合化を目的としている。
以前の研究は、対象データにスパース単一ピクセルアノテーションという形で、人間のインタラクションをこのプロセスに含めようと試みていた。
アクティブな選択による注釈付きポイントを用いた意味的セグメンテーションのための新しいドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-01T01:52:28Z) - Feature Diversity Learning with Sample Dropout for Unsupervised Domain
Adaptive Person Re-identification [0.0]
本稿では,ノイズの多い擬似ラベルを限定することで,より優れた一般化能力を持つ特徴表現を学習する手法を提案する。
我々は,古典的な相互学習アーキテクチャの下で,FDL(Feature Diversity Learning)と呼ばれる新しい手法を提案する。
実験の結果,提案するFDL-SDは,複数のベンチマークデータセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-01-25T10:10:48Z) - Boosting Unsupervised Domain Adaptation with Soft Pseudo-label and
Curriculum Learning [19.903568227077763]
教師なしドメイン適応(UDA)は、完全にラベル付けされたソースドメインからのデータを活用することにより、ラベル付けされていないターゲットドメインの分類性能を向上させる。
ソフトな擬似ラベル戦略を用いてモデル予測の欠陥を大幅に低減するモデルに依存しない2段階学習フレームワークを提案する。
第2段階では,2つのドメインの損失間の重み付けを適応的に制御するカリキュラム学習戦略を提案する。
論文 参考訳(メタデータ) (2021-12-03T14:47:32Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Effective Label Propagation for Discriminative Semi-Supervised Domain
Adaptation [76.41664929948607]
半教師付き領域適応(SSDA)法は,大規模な画像分類タスクにおいて大きな可能性を示している。
本稿では、ドメイン間およびドメイン内セマンティック情報を効果的に伝達することにより、この問題に対処する新しい効果的な方法を提案する。
ソースコードと事前訓練されたモデルも間もなくリリースされる予定です。
論文 参考訳(メタデータ) (2020-12-04T14:28:19Z) - Instance Adaptive Self-Training for Unsupervised Domain Adaptation [19.44504738538047]
セマンティックセグメンテーションの課題に対して,UDAのためのインスタンス適応型自己学習フレームワークを提案する。
擬似ラベルの品質を効果的に向上するために,インスタンス適応セレクタを用いた新しい擬似ラベル生成戦略を開発した。
我々の手法は簡潔で効率的であり、他の教師なし領域適応法に容易に一般化できる。
論文 参考訳(メタデータ) (2020-08-27T15:50:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。