論文の概要: Stream-based Active Learning with Verification Latency in Non-stationary
Environments
- arxiv url: http://arxiv.org/abs/2204.06822v1
- Date: Thu, 14 Apr 2022 08:51:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 22:42:42.246592
- Title: Stream-based Active Learning with Verification Latency in Non-stationary
Environments
- Title(参考訳): 非定常環境における検証レイテンシを用いたストリームベースアクティブラーニング
- Authors: Andrea Castellani, Sebastian Schmitt, Barbara Hammer
- Abstract要約: 本研究では, 有限, 時間可変, 未知の検証遅延が, 概念ドリフトの有無がALアプローチに与える影響について検討する。
PRopagateは、要求されたがまだ知られていないラベルを予測する遅延独立ユーティリティ推定器である。
提案手法が常に最先端の手法よりも優れていることを実証的に示す。
- 参考スコア(独自算出の注目度): 6.883906273999368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data stream classification is an important problem in the field of machine
learning. Due to the non-stationary nature of the data where the underlying
distribution changes over time (concept drift), the model needs to continuously
adapt to new data statistics. Stream-based Active Learning (AL) approaches
address this problem by interactively querying a human expert to provide new
data labels for the most recent samples, within a limited budget. Existing AL
strategies assume that labels are immediately available, while in a real-world
scenario the expert requires time to provide a queried label (verification
latency), and by the time the requested labels arrive they may not be relevant
anymore. In this article, we investigate the influence of finite,
time-variable, and unknown verification delay, in the presence of concept drift
on AL approaches. We propose PRopagate (PR), a latency independent utility
estimator which also predicts the requested, but not yet known, labels.
Furthermore, we propose a drift-dependent dynamic budget strategy, which uses a
variable distribution of the labelling budget over time, after a detected
drift. Thorough experimental evaluation, with both synthetic and real-world
non-stationary datasets, and different settings of verification latency and
budget are conducted and analyzed. We empirically show that the proposed method
consistently outperforms the state-of-the-art. Additionally, we demonstrate
that with variable budget allocation in time, it is possible to boost the
performance of AL strategies, without increasing the overall labeling budget.
- Abstract(参考訳): データストリームの分類は、機械学習の分野で重要な問題である。
基礎となる分散が時間とともに変化するデータの非定常性(概念ドリフト)のため、モデルは新しいデータ統計に継続的に適応する必要がある。
ストリームベースのアクティブラーニング(al)アプローチは、人間の専門家にインタラクティブにクエリして、限られた予算内で最新のサンプルに新しいデータラベルを提供することによって、この問題に対処します。
既存のal戦略では、ラベルはすぐに利用できると仮定しているが、実際のシナリオでは、専門家はクエリされたラベル(検証遅延)を提供する時間を必要とし、要求されたラベルが到着する頃には、もはや関係がないかもしれない。
本稿では,alアプローチにおける概念ドリフトの存在下での有限,時間変数,未知の検証遅延の影響について検討する。
PRopagate (PR) は遅延に依存しないユーティリティ推定器で、要求されたがまだ分かっていないラベルを予測できる。
さらに,ドリフト検出後,時間とともにラベル付予算の変動分布を利用するドリフト依存型動的予算戦略を提案する。
合成および実世界の非定常データセットと、検証待ち時間と予算の異なる設定を用いて、詳細な実験的評価を行い、分析した。
提案手法が常に最先端技術より優れていることを実証的に示す。
さらに, 予算配分の変動により, 総合的なラベル付け予算を増大させることなく, AL戦略の性能を高めることができることを示した。
関連論文リスト
- Label Delay in Online Continual Learning [77.05325581370893]
しばしば見過ごされる重要な側面はラベルの遅延であり、遅くてコストのかかるアノテーションプロセスのために新しいデータがラベル付けされない可能性がある。
本稿では,データとラベルストリーム間のラベル遅延を,時間経過とともに明示的にモデル化した新しい連続学習フレームワークを提案する。
提案手法はラベル遅延係数に最も影響を受けていないことを示し、場合によっては非遅延の精度を回復させる。
論文 参考訳(メタデータ) (2023-12-01T20:52:10Z) - An Adaptive Method for Weak Supervision with Drifting Data [11.035811912078216]
非定常的な環境では,厳格な品質保証を施した適応手法を導入する。
我々は、弱い監督源の精度が時間とともにドリフトできる非定常的なケースに焦点を当てる。
我々のアルゴリズムはドリフトの大きさに関する仮定を一切必要とせず、入力に基づいて適応する。
論文 参考訳(メタデータ) (2023-06-02T16:27:34Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Stream-based active learning with linear models [0.7734726150561089]
生産において、製品情報を取得するためにランダム検査を行う代わりに、ラベルなしデータの情報内容を評価することによりラベルを収集する。
本稿では,ストリームベースのシナリオを学習者に順次提供するための新たな戦略を提案する。
未ラベルデータポイントの通知性にしきい値を設定することにより、意思決定プロセスの反復的な側面に取り組む。
論文 参考訳(メタデータ) (2022-07-20T13:15:23Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Mining Drifting Data Streams on a Budget: Combining Active Learning with
Self-Labeling [6.436899373275926]
本稿では,アクティブラーニングと自己ラベルによる情報を組み合わせることで,ドリフトするデータストリームを予算でマイニングする新しいフレームワークを提案する。
我々は,概念ドリフトの可能性を考慮して,インテリジェントなインスタンス選択と半教師付き手順の両方を活用できる戦略をいくつか導入する。
論文 参考訳(メタデータ) (2021-12-21T07:19:35Z) - Knowledge-driven Active Learning [70.37119719069499]
アクティブな学習戦略は、ディープラーニングモデルをトレーニングするために必要なラベル付きデータの量を最小限にすることを目的としている。
ほとんどの積極的な戦略は不確実なサンプルの選択に基づいており、しばしば決定境界に近いサンプルに制限される。
本稿では、一般的なドメイン知識を考慮し、エキスパートでないユーザがより少ないサンプルでモデルを訓練できるようにする。
論文 参考訳(メタデータ) (2021-10-15T06:11:53Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - Task-Aware Variational Adversarial Active Learning [42.334671410592065]
本稿では,タスク非依存のVAALを修飾するタスク対応可変逆数AL(TA-VAAL)を提案する。
提案するTA-VAALは、バランスの取れたラベルとバランスの取れないラベルの分類のための様々なベンチマークデータセットにおいて、最先端の性能を向上する。
論文 参考訳(メタデータ) (2020-02-11T22:00:48Z) - Low-Budget Label Query through Domain Alignment Enforcement [48.06803561387064]
我々は低予算ラベルクエリと呼ばれる新しい問題に取り組む。
まず、ソースとターゲットドメインの整合性を改善するために、Unsupervised Domain Adaptation (UDA) 法を改善します。
そこで我々は,予測整合分布の均一サンプリングに基づく簡易かつ効果的な選択法を提案する。
論文 参考訳(メタデータ) (2020-01-01T16:52:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。