論文の概要: Concept Drift Detection from Multi-Class Imbalanced Data Streams
- arxiv url: http://arxiv.org/abs/2104.10228v1
- Date: Tue, 20 Apr 2021 20:03:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:22:36.299949
- Title: Concept Drift Detection from Multi-Class Imbalanced Data Streams
- Title(参考訳): 多種不均衡データストリームからの概念ドリフト検出
- Authors: {\L}ukasz Korycki, Bartosz Krawczyk
- Abstract要約: Restricted Boltzmann Machineに基づく新しい訓練可能なコンセプトドリフトディテクタを提案する。
複数のクラスを同時に監視し、レコンストラクションエラーを使用して各クラスの変更を独立して検出することができる。
この検出器はスキュー非感受性損失関数を利用して複数の不均衡分布を処理できる。
- 参考スコア(独自算出の注目度): 6.436899373275926
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continual learning from data streams is among the most important topics in
contemporary machine learning. One of the biggest challenges in this domain
lies in creating algorithms that can continuously adapt to arriving data.
However, previously learned knowledge may become outdated, as streams evolve
over time. This phenomenon is known as concept drift and must be detected to
facilitate efficient adaptation of the learning model. While there exists a
plethora of drift detectors, all of them assume that we are dealing with
roughly balanced classes. In the case of imbalanced data streams, those
detectors will be biased towards the majority classes, ignoring changes
happening in the minority ones. Furthermore, class imbalance may evolve over
time and classes may change their roles (majority becoming minority and vice
versa). This is especially challenging in the multi-class setting, where
relationships among classes become complex. In this paper, we propose a
detailed taxonomy of challenges posed by concept drift in multi-class
imbalanced data streams, as well as a novel trainable concept drift detector
based on Restricted Boltzmann Machine. It is capable of monitoring multiple
classes at once and using reconstruction error to detect changes in each of
them independently. Our detector utilizes a skew-insensitive loss function that
allows it to handle multiple imbalanced distributions. Due to its trainable
nature, it is capable of following changes in a stream and evolving class
roles, as well as it can deal with local concept drift occurring in minority
classes. Extensive experimental study on multi-class drifting data streams,
enriched with a detailed analysis of the impact of local drifts and changing
imbalance ratios, confirms the high efficacy of our approach.
- Abstract(参考訳): データストリームからの継続的な学習は、現代の機械学習において最も重要なトピックである。
この領域で最大の課題のひとつは、到着したデータに継続的に適応可能なアルゴリズムを作成することだ。
しかし、ストリームが時間とともに進化するにつれて、以前に学んだ知識は時代遅れになる可能性がある。
この現象は概念ドリフトと呼ばれ、学習モデルの効率的な適応を容易にするために検出されなければならない。
ドリフト検出器は多数存在するが、いずれも私たちが概ねバランスの取れたクラスを扱っていると仮定している。
不均衡なデータストリームの場合、これらの検出器は多数派クラスに偏り、少数派で起こる変化を無視します。
さらに、クラス不均衡は時間とともに進化し、クラスはその役割を変える(多数派が少数派になり、その逆も)。
これはクラス間の関係が複雑になるマルチクラス設定において特に難しい。
本稿では,マルチクラス不均衡データストリームにおける概念ドリフトによって生じる課題の詳細な分類と,制限ボルツマンマシンに基づく新しい学習可能な概念ドリフト検出器を提案する。
複数のクラスを同時に監視し、レコンストラクションエラーを使用して各クラスの変更を独立して検出することができる。
この検出器はスキュー非感受性損失関数を利用して複数の不均衡分布を処理できる。
訓練可能な性質のため、ストリームの変更と進化するクラスの役割を追従できるだけでなく、マイノリティクラスで発生するローカルな概念のドリフトに対処することができる。
局所的なドリフトの影響と不均衡率の変化を詳細に分析したマルチクラスドリフトデータストリームの大規模実験により,本手法の有効性を確認した。
関連論文リスト
- SMOClust: Synthetic Minority Oversampling based on Stream Clustering for
Evolving Data Streams [4.378407481656902]
本稿では,ストリームクラスタリングに基づくマイノリティクラスを合成するためのドリフトオーバーサンプリング戦略を提案する。
その動機は、ストリームクラスタリングメソッドが、現在の根底にある概念の特徴を反映するために、継続的に更新されることです。
人工的および実世界のデータストリームを用いた実験により、提案手法は既存の手法よりも多様なマイノリティクラス分解を含む概念ドリフトを処理可能であることが示された。
論文 参考訳(メタデータ) (2023-08-28T19:06:03Z) - The Influence of Multiple Classes on Learning Online Classifiers from
Imbalanced and Concept Drifting Data Streams [1.370633147306388]
局所的なデータ特性とドリフトは不均衡なデータストリームで研究される。
分裂する少数民族の局所的な流れが第三の要因である。
バイナリストリームとは異なり、特殊な UOB と OOB の分類器は高い不均衡比でも十分に機能する。
論文 参考訳(メタデータ) (2022-10-15T19:15:50Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Discrete Key-Value Bottleneck [95.61236311369821]
ディープニューラルネットワークは、データストリームがi.d.d.であり、ラベル付きデータが豊富である分類タスクでうまく機能する。
この課題に対処した強力なアプローチの1つは、手軽に利用可能なデータ量に対する大規模なエンコーダの事前トレーニングと、タスク固有のチューニングである。
しかし、新しいタスクを考えると、多くの重みを微調整する必要があるため、エンコーダの重みを更新することは困難であり、その結果、以前のタスクに関する情報を忘れてしまう。
この問題に対処するモデルアーキテクチャを提案し,個別かつ学習可能なキー値符号のペアを含む離散的ボトルネックの上に構築する。
論文 参考訳(メタデータ) (2022-07-22T17:52:30Z) - Calibrating Class Weights with Multi-Modal Information for Partial Video
Domain Adaptation [18.6604339776585]
不正なクラス重みによる負の移動を軽減するために,マルチモーダルクラスタ対部分アドリアネットワーク(MCAN)を提案する。
MCANは、複数の時間スケールからのマルチモーダル機能によるビデオ特徴抽出を強化し、より堅牢な全体的な特徴を形成する。
論文 参考訳(メタデータ) (2022-04-13T06:12:17Z) - Do Deep Networks Transfer Invariances Across Classes? [123.84237389985236]
ニュアンス変換を学習するための生成的アプローチが、クラス間での不変性の伝達にどのように役立つかを示す。
この結果から,不均衡分布や細長い分布に対して分類器が不規則に一般化する理由が示唆された。
論文 参考訳(メタデータ) (2022-03-18T04:38:18Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Concept drift detection and adaptation for federated and continual
learning [55.41644538483948]
スマートデバイスは環境から大量のデータを収集することができる。
このデータは機械学習モデルのトレーニングに適しており、その振る舞いを大幅に改善することができる。
そこで本研究では,Concept-Drift-Aware Federated Averagingと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-27T17:01:58Z) - Drift-Aware Multi-Memory Model for Imbalanced Data Streams [5.71097144710995]
メモリベースモデルのオンライン学習におけるクラスアンバランス問題に対処するために,Drift-Aware Multi-Memory Model (DAM3)を提案する。
dam3は、不均衡感受性ドリフト検出器を内蔵し、モデル内のクラスのバランスのとれた表現を保存し、ワーキングメモリを用いた遡及的干渉を解決することで、クラス不均衡を緩和する。
実世界および合成データセットの実験を通じて,提案手法がクラス不均衡を緩和し,最新手法を上回っていることを示した。
論文 参考訳(メタデータ) (2020-12-29T15:06:30Z) - Adversarial Concept Drift Detection under Poisoning Attacks for Robust
Data Stream Mining [15.49323098362628]
本稿では,敵対的攻撃と毒殺攻撃の存在下でのロバストな概念ドリフト検出のための枠組みを提案する。
本稿では,2種類の逆流の概念と,頑健な訓練可能なドリフト検出器の分類について紹介する。
また,ロバストネスの相対損失 (Relative Loss of Robustness) についても紹介する。
論文 参考訳(メタデータ) (2020-09-20T18:46:31Z) - Laplacian Denoising Autoencoder [114.21219514831343]
本稿では,新しいタイプの自動符号化器を用いてデータ表現を学習することを提案する。
勾配領域における潜伏クリーンデータを破損させて雑音入力データを生成する。
いくつかのビジュアルベンチマークの実験では、提案されたアプローチでより良い表現が学べることが示されている。
論文 参考訳(メタデータ) (2020-03-30T16:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。