論文の概要: Concept Drift and Covariate Shift Detection Ensemble with Lagged Labels
- arxiv url: http://arxiv.org/abs/2012.04759v3
- Date: Tue, 15 Dec 2020 03:49:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:26:49.034845
- Title: Concept Drift and Covariate Shift Detection Ensemble with Lagged Labels
- Title(参考訳): ラベルを付加したコンセプトドリフトと共変量シフト検出
- Authors: Yiming Xu, Diego Klabjan
- Abstract要約: 変更を検出し、モデルを再訓練することが重要です。
1) 分類誤り率のみを信号として使用すること,2) サンプルから特徴が受信された後に真実ラベルがすぐに利用可能であると仮定すること,3) 変更時にモデルの再トレーニングに使用するデータを決定することができないこと,の3つの弱点がある。
まず,6つの異なる信号を用いてデータの特徴を広範囲に把握し,ラベルのラグを許容し,ラグ後に対応する特徴のラベルを受信することで,第2の問題を解決する。
第3の問題として,提案手法は再トレーニングに使用するデータを自動的に決定する。
- 参考スコア(独自算出の注目度): 22.826118321715455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In model serving, having one fixed model during the entire often life-long
inference process is usually detrimental to model performance, as data
distribution evolves over time, resulting in lack of reliability of the model
trained on historical data. It is important to detect changes and retrain the
model in time. The existing methods generally have three weaknesses: 1) using
only classification error rate as signal, 2) assuming ground truth labels are
immediately available after features from samples are received and 3) unable to
decide what data to use to retrain the model when change occurs. We address the
first problem by utilizing six different signals to capture a wide range of
characteristics of data, and we address the second problem by allowing lag of
labels, where labels of corresponding features are received after a lag in
time. For the third problem, our proposed method automatically decides what
data to use to retrain based on the signals. Extensive experiments on
structured and unstructured data for different type of data changes establish
that our method consistently outperforms the state-of-the-art methods by a
large margin.
- Abstract(参考訳): モデルサービスでは、生涯にわたる推論プロセス全体を通して1つの固定されたモデルを持つことは、データ分散が時間とともに進化するにつれて、モデルのパフォーマンスを損なうことになり、履歴データでトレーニングされたモデルの信頼性が失われる。
変更を検出し、モデルを再トレーニングすることが重要です。
既存の手法では,(1)分類誤り率のみを信号として使用すること,(2)サンプルから特徴が受信された後に真実ラベルがすぐに利用可能であると仮定すること,(3)変更時にモデルの再トレーニングに使用するデータを決定することができないこと,の3つの弱点がある。
まず,6つの異なる信号を用いてデータの特徴を広範囲に把握し,ラベルのラグを許容し,ラグ後に対応する特徴のラベルを受信することで,第2の問題を解決する。
第3の問題として,提案手法では,信号に基づいて再トレーニングするデータを自動的に決定する。
異なる種類のデータ変更に対する構造化データと非構造化データに関する広範囲な実験は、この手法が最先端のメソッドを一貫して高いマージンで上回っていることを証明している。
関連論文リスト
- Towards Zero-shot 3D Anomaly Localization [58.62650061201283]
3DzALは3D異常検出とローカライゼーションのためのパッチレベルの新しいコントラスト学習フレームワークである。
3DzALは最先端の異常検出および局所化性能より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-05T16:25:27Z) - LARA: A Light and Anti-overfitting Retraining Approach for Unsupervised
Time Series Anomaly Detection [49.52429991848581]
深部変分自動エンコーダに基づく時系列異常検出手法(VAE)のための光・反オーバーフィット学習手法(LARA)を提案する。
本研究の目的は,1) 再学習過程を凸問題として定式化し, 過度に収束できること,2) 履歴データを保存せずに活用するルミネートブロックを設計すること,3) 潜在ベクトルと再構成データの微調整を行うと, 線形形成が基底真実と微調整されたブロックとの誤りを最小に調整できることを数学的に証明することである。
論文 参考訳(メタデータ) (2023-10-09T12:36:16Z) - Robust Outlier Rejection for 3D Registration with Variational Bayes [70.98659381852787]
我々は、ロバストアライメントのための新しい変分非局所ネットワークベース外乱除去フレームワークを開発した。
そこで本稿では, 投票に基づく不整合探索手法を提案し, 変換推定のための高品質な仮説的不整合をクラスタリングする。
論文 参考訳(メタデータ) (2023-04-04T03:48:56Z) - Informative regularization for a multi-layer perceptron RR Lyrae
classifier under data shift [3.303002683812084]
本稿では,情報正規化とアドホックなトレーニング手法に基づくスケーラブルで容易に適応可能なアプローチを提案し,シフト問題を緩和する。
提案手法は,特徴量からの知識をニューラルネットワークに組み込むことで,基礎となるデータシフト問題を管理する。
論文 参考訳(メタデータ) (2023-03-12T02:49:19Z) - Time-Varying Propensity Score to Bridge the Gap between the Past and Present [104.46387765330142]
本稿では,データ分布の段階的変化を検出するための時間変化確率スコアを提案する。
実装のさまざまな方法を示し、さまざまな問題について評価する。
論文 参考訳(メタデータ) (2022-10-04T07:21:49Z) - Data Feedback Loops: Model-driven Amplification of Dataset Biases [9.773315369593876]
我々は、あるモデルとのインタラクションを履歴として記録し、将来トレーニングデータとしてスクラップ化するシステムを定式化する。
テスト時間偏差統計に対する変化を追跡することによって、その安定性を経時的に分析する。
バイアス増幅の度合いは、モデルの出力がトレーニング分布のサンプルのように振る舞うかどうかと密接に関連していることがわかった。
論文 参考訳(メタデータ) (2022-09-08T17:35:51Z) - Latent Outlier Exposure for Anomaly Detection with Contaminated Data [31.446666264334528]
異常検出は、ラベルなしデータセットの大多数のデータから体系的なずれを示すデータポイントを特定することを目的としている。
本稿では,広範囲のモデルと互換性のあるラベルのない異常が存在する場合に,異常検知器を訓練するための戦略を提案する。
論文 参考訳(メタデータ) (2022-02-16T14:21:28Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。