論文の概要: Responsible Active Learning via Human-in-the-loop Peer Study
- arxiv url: http://arxiv.org/abs/2211.13587v1
- Date: Thu, 24 Nov 2022 13:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 15:25:45.768100
- Title: Responsible Active Learning via Human-in-the-loop Peer Study
- Title(参考訳): Human-in-the-loop Peer Studyによるレスポンシブルアクティブラーニング
- Authors: Yu-Tong Cao, Jingya Wang, Baosheng Yu, Dacheng Tao
- Abstract要約: 我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。
まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
- 参考スコア(独自算出の注目度): 88.01358655203441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active learning has been proposed to reduce data annotation efforts by only
manually labelling representative data samples for training. Meanwhile, recent
active learning applications have benefited a lot from cloud computing services
with not only sufficient computational resources but also crowdsourcing
frameworks that include many humans in the active learning loop. However,
previous active learning methods that always require passing large-scale
unlabelled data to cloud may potentially raise significant data privacy issues.
To mitigate such a risk, we propose a responsible active learning method,
namely Peer Study Learning (PSL), to simultaneously preserve data privacy and
improve model stability. Specifically, we first introduce a human-in-the-loop
teacher-student architecture to isolate unlabelled data from the task learner
(teacher) on the cloud-side by maintaining an active learner (student) on the
client-side. During training, the task learner instructs the light-weight
active learner which then provides feedback on the active sampling criterion.
To further enhance the active learner via large-scale unlabelled data, we
introduce multiple peer students into the active learner which is trained by a
novel learning paradigm, including the In-Class Peer Study on labelled data and
the Out-of-Class Peer Study on unlabelled data. Lastly, we devise a
discrepancy-based active sampling criterion, Peer Study Feedback, that exploits
the variability of peer students to select the most informative data to improve
model stability. Extensive experiments demonstrate the superiority of the
proposed PSL over a wide range of active learning methods in both standard and
sensitive protection settings.
- Abstract(参考訳): トレーニング用のデータサンプルを手動でラベル付けするだけでデータアノテーションの労力を削減するために,アクティブラーニングが提案されている。
一方、最近のアクティブラーニングアプリケーションは、十分な計算リソースだけでなく、アクティブラーニングループに多くの人間を含むクラウドソーシングフレームワークによって、クラウドコンピューティングサービスから多くの恩恵を受けています。
しかし、大規模で遅延のないデータをクラウドに渡す必要のある従来のアクティブな学習方法は、データプライバシの問題を引き起こす可能性がある。
このようなリスクを軽減するために,データプライバシの保護とモデル安定性の向上を同時に行うピアスタディラーニング(psl)という,責任あるアクティブラーニング手法を提案する。
具体的には、まず、クラウド側のタスク学習者(教師)から、クライアント側のアクティブ学習者(学生)を維持することにより、未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
大規模未学習データによるアクティブ学習者をさらに強化するために,ラベル付きデータに関するインクラスピアスタディや未学習データに関するアウトオブクラスピアスタディなど,新しい学習パラダイムによって訓練されたアクティブ学習者に複数のピア学習者を紹介する。
最後に,ピアスタディ・フィードバック(Peer Study Feedback)という,差分に基づくアクティブサンプリング基準を考案した。
広汎な実験は、標準および機密保護設定の両方において、幅広い能動的学習方法よりも提案したPSLの方が優れていることを示す。
関連論文リスト
- Active Learning to Guide Labeling Efforts for Question Difficulty Estimation [1.0514231683620516]
トランスフォーマーベースのニューラルネットワークは、主に教師なしの手法ではなく、教師なし学習における独立した研究によって、最先端のパフォーマンスを達成する。
この研究は、教師付きヒューマン・イン・ザ・ループアプローチであるQDEのアクティブ・ラーニングを探求することで、研究ギャップを埋める。
PowerVarianceの取得によるアクティブな学習は、トレーニングデータの10%だけをラベル付けした後、完全に教師されたモデルに近いパフォーマンスを達成することを示す実験である。
論文 参考訳(メタデータ) (2024-09-14T02:02:42Z) - Advancing Deep Active Learning & Data Subset Selection: Unifying
Principles with Information-Theory Intuitions [3.0539022029583953]
本論文は,ディープラーニングモデルのラベルとトレーニング効率を向上させることにより,ディープラーニングの実践性を高めることを目的とする。
本稿では,情報理論の原理に基づくデータサブセット選択手法,特にアクティブラーニングとアクティブサンプリングについて検討する。
論文 参考訳(メタデータ) (2024-01-09T01:41:36Z) - Model Uncertainty based Active Learning on Tabular Data using Boosted
Trees [0.4667030429896303]
監視された機械学習は、モデルトレーニングのための良質なラベル付きデータの可用性に依存している。
アクティブな学習は機械学習のサブフィールドであり、ラベル付きデータを効率的に取得するのに役立つ。
論文 参考訳(メタデータ) (2023-10-30T14:29:53Z) - Active Learning with Contrastive Pre-training for Facial Expression
Recognition [19.442685015494316]
本研究では,3つの公開FERデータセットを用いた最近のアクティブラーニング手法について検討する。
その結果,既存のアクティブラーニング手法はFERの文脈ではうまく動作しないことがわかった。
本稿では,まず,非ラベルデータセット全体に基づいて基礎となる表現を学習する,自己教師付き事前学習を提案する。
論文 参考訳(メタデータ) (2023-07-06T03:08:03Z) - SURF: Semi-supervised Reward Learning with Data Augmentation for
Feedback-efficient Preference-based Reinforcement Learning [168.89470249446023]
我々は、大量のラベルなしサンプルとデータ拡張を利用する半教師付き報酬学習フレームワークSURFを提案する。
報奨学習にラベルのないサンプルを活用するために,選好予測器の信頼性に基づいてラベルのないサンプルの擬似ラベルを推定する。
本実験は, ロボット操作作業における嗜好に基づく手法のフィードバック効率を有意に向上させることを実証した。
論文 参考訳(メタデータ) (2022-03-18T16:50:38Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Mind Your Outliers! Investigating the Negative Impact of Outliers on
Active Learning for Visual Question Answering [71.15403434929915]
視覚的質問応答のタスクにおいて、5つのモデルと4つのデータセットにまたがって、多種多様な能動的学習アプローチがランダム選択を上回りません。
アクティブな学習手法が好まれるが、モデルは学習に失敗する例の集まりである。
本研究では,アクティブ学習プールにおける集団外乱の減少に伴い,アクティブ学習サンプル効率が著しく向上することを示す。
論文 参考訳(メタデータ) (2021-07-06T00:52:11Z) - Active Learning: Problem Settings and Recent Developments [2.1574781022415364]
本稿では,アクティブラーニングの基本的課題と最近の研究動向について述べる。
特に,ラベリング用データからサンプルを選択する学習獲得関数の研究,アクティブ学習アルゴリズムに関する理論的研究,逐次データ取得のための停止基準について注目する。
論文 参考訳(メタデータ) (2020-12-08T05:24:06Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。