論文の概要: Active Weighted Aging Ensemble for Drifted Data Stream Classification
- arxiv url: http://arxiv.org/abs/2112.10150v1
- Date: Sun, 19 Dec 2021 13:52:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 06:13:24.940310
- Title: Active Weighted Aging Ensemble for Drifted Data Stream Classification
- Title(参考訳): ドリフトデータストリーム分類のためのアクティブ重み付け時効アンサンブル
- Authors: Micha{\l} Wo\'zniak, Pawe{\l} Zyblewski and Pawe{\l} Ksieniewicz
- Abstract要約: 概念ドリフトは分類モデルの性能を不安定化し、その品質を著しく低下させる。
提案手法は実データストリームと実データストリームの両方を用いて計算機実験により評価されている。
その結果,提案アルゴリズムは最先端手法よりも高品質であることが確認された。
- 参考スコア(独自算出の注目度): 2.277447144331876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the significant problems of streaming data classification is the
occurrence of concept drift, consisting of the change of probabilistic
characteristics of the classification task. This phenomenon destabilizes the
performance of the classification model and seriously degrades its quality. An
appropriate strategy counteracting this phenomenon is required to adapt the
classifier to the changing probabilistic characteristics. One of the
significant problems in implementing such a solution is the access to data
labels. It is usually costly, so to minimize the expenses related to this
process, learning strategies based on semi-supervised learning are proposed,
e.g., employing active learning methods indicating which of the incoming
objects are valuable to be labeled for improving the classifier's performance.
This paper proposes a novel chunk-based method for non-stationary data streams
based on classifier ensemble learning and an active learning strategy
considering a limited budget that can be successfully applied to any data
stream classification algorithm. The proposed method has been evaluated through
computer experiments using both real and generated data streams. The results
confirm the high quality of the proposed algorithm over state-of-the-art
methods.
- Abstract(参考訳): ストリーミングデータ分類の重要な問題の1つは、分類タスクの確率的特性の変化からなる概念ドリフトの発生である。
この現象は分類モデルの性能を不安定にし、品質を著しく低下させる。
この現象に対処する適切な戦略は、分類器を確率特性の変化に適応させる必要がある。
このようなソリューションを実装する上で大きな問題の1つは、データラベルへのアクセスである。
通常は費用がかかるため、半教師付き学習に基づく学習戦略が提案されており、例えば、分類器の性能を向上させるためにラベル付けされる対象のどれが価値があるかを示すアクティブな学習手法が提案されている。
本稿では,任意のデータストリーム分類アルゴリズムに適用可能な限定予算を考慮した,分類子アンサンブル学習に基づく非定常データストリームのチャンクベース手法とアクティブラーニング戦略を提案する。
提案手法は実データストリームと生成データストリームの両方を用いてコンピュータ実験により評価されている。
その結果,提案アルゴリズムは最先端手法よりも高品質であることが確認された。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Meta-learning for Positive-unlabeled Classification [40.11462237689747]
提案手法は,モデルがPUデータに適用された後のテスト分類リスクを最小限に抑える。
この方法は各インスタンスをニューラルネットワークを使ってタスク固有の空間に埋め込む。
提案手法は1つの実世界のデータセットと3つの実世界のデータセットで既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-06T01:50:01Z) - NTKCPL: Active Learning on Top of Self-Supervised Model by Estimating
True Coverage [3.4806267677524896]
ニューラル・タンジェント・カーネル・クラスタリング・プシュード・ラベル(NTKCPL)の新しいアクティブ・ラーニング・ストラテジーを提案する。
擬似ラベルとNTK近似を用いたモデル予測に基づいて経験的リスクを推定する。
提案手法を5つのデータセット上で検証し,ほとんどの場合,ベースライン法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-07T01:43:47Z) - Continual Learning For On-Device Environmental Sound Classification [63.81276321857279]
デバイス上での環境音の分類のための簡易かつ効率的な連続学習法を提案する。
本手法は,サンプルごとの分類の不確実性を測定することにより,トレーニングの履歴データを選択する。
論文 参考訳(メタデータ) (2022-07-15T12:13:04Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - Unsupervised feature selection via self-paced learning and low-redundant
regularization [6.083524716031565]
自己評価学習とサブスペース学習の枠組みを統合することにより,教師なしの特徴選択を提案する。
この手法の収束性は理論的および実験的に証明される。
実験の結果,提案手法はクラスタリング法の性能を向上し,他の比較アルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-14T08:28:19Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z) - Ensemble Wrapper Subsampling for Deep Modulation Classification [70.91089216571035]
受信した無線信号のサブサンプリングは、ハードウェア要件と信号処理アルゴリズムの計算コストを緩和するために重要である。
本稿では,無線通信システムにおけるディープラーニングを用いた自動変調分類のためのサブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-10T06:11:13Z) - Fase-AL -- Adaptation of Fast Adaptive Stacking of Ensembles for
Supporting Active Learning [0.0]
本研究は,Active Learning を用いて非ラベルのインスタンスで分類モデルを誘導する FASE-AL アルゴリズムを提案する。
このアルゴリズムは、正しく分類されたインスタンスの割合で有望な結果を得る。
論文 参考訳(メタデータ) (2020-01-30T17:25:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。