論文の概要: Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection
- arxiv url: http://arxiv.org/abs/2603.06757v1
- Date: Fri, 06 Mar 2026 13:43:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.088463
- Title: Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection
- Title(参考訳): 解釈不能な概念ドリフト検出のためのアンバイアスクラスタ記述子学習
- Authors: Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng,
- Abstract要約: 大規模クラスタの圧倒的な統計は、小さなクラスタ分布の漂流を容易に隠蔽することができる。
我々は,不均衡な概念に偏りのない不均衡クラスタ記述子に基づくドリフト検出(ICD3)を提案する。
ICD3はドリフトされた概念を特に位置決めすることで高い解釈可能性を示し、概念の不均衡比の変化に対して堅牢である。
- 参考スコア(独自算出の注目度): 18.6233154307777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlabeled streaming data are usually collected to describe dynamic systems, where concept drift detection is a vital prerequisite to understanding the evolution of systems. However, the drifting concepts are usually imbalanced in most real cases, which brings great challenges to drift detection. That is, the dominant statistics of large clusters can easily mask the drifting of small cluster distributions (also called small concepts), which is known as the `masking effect'. Considering that most existing approaches only detect the overall existence of drift under the assumption of balanced concepts, two critical problems arise: 1) where the small concept is, and 2) how to detect its drift. To address the challenging concept drift detection for imbalanced data, we propose Imbalanced Cluster Descriptor-based Drift Detection (ICD3) approach that is unbiased to the imbalanced concepts. This approach first detects imbalanced concepts by employing a newly designed multi-distribution-granular search, which ensures that the distribution of both small and large concepts is effectively captured. Subsequently, it trains a One-Cluster Classifier (OCC) for each identified concept to carefully monitor their potential drifts in the upcoming data chunks. Since the detection is independently performed for each concept, the dominance of large clusters is thus circumvented. ICD3 demonstrates highly interpretability by specifically locating the drifted concepts, and is robust to the changing of the imbalance ratio of concepts. Comprehensive experiments with multi-aspect ablation studies conducted on various benchmark datasets demonstrate the superiority of ICD3 against the state-of-the-art counterparts.
- Abstract(参考訳): ラベルのないストリーミングデータは通常、動的システムを記述するために収集される。
しかし、ドリフトの概念は通常、ほとんどの実例では不均衡であり、ドリフト検出には大きな課題をもたらす。
すなわち、大クラスタの圧倒的な統計は、「マスキング効果」として知られる小さなクラスタ分布(小概念とも呼ばれる)の漂流を、容易に隠蔽することができる。
既存のほとんどのアプローチは、バランスの取れた概念を仮定してドリフトの全体的存在を検知することしかできないので、2つの重要な問題が発生する。
1)小さな概念がどこにあるか、そして
2) ドリフトの検出方法。
不均衡データに対する難解なドリフト検出に対処するため,不均衡クラスタ記述子に基づくドリフト検出(ICD3)手法を提案する。
このアプローチは、まず、新しく設計された多分布粒度探索を用いて、不均衡な概念を検知し、小さくて大きな概念の分布を効果的に捉える。
その後、識別された概念ごとにOCC(One-Cluster Classifier)をトレーニングし、今後のデータチャンク内の潜在的なドリフトを注意深く監視する。
検出は各概念ごとに独立に行われるので、大きなクラスタの優位性は回避される。
ICD3はドリフトされた概念を特に位置決めすることで高い解釈可能性を示し、概念の不均衡比の変化に対して堅牢である。
様々なベンチマークデータセットを用いたマルチアスペクトアブレーションによる総合的な実験により、ICD3の最先端技術に対する優位性を実証した。
関連論文リスト
- Rethinking Concept Bottleneck Models: From Pitfalls to Solutions [53.84388497227224]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念の基底予測である。
CBM-Suiteはこれらの課題に対処するための方法論的なフレームワークである。
論文 参考訳(メタデータ) (2026-03-05T19:37:49Z) - Stabilizing Information Flow Entropy: Regularization for Safe and Interpretable Autonomous Driving Perception [8.543667347406286]
我々はディープニューラルエンコーダを階層型通信チェーンとして再認識し、生の知覚入力をタスク関連潜在特徴に圧縮する。
Elossは,軽量でプラグアンドプレイの学習目標として設計された,エントロピーベースの新しい正規化器である。
論文 参考訳(メタデータ) (2025-09-18T17:01:27Z) - Fair Deepfake Detectors Can Generalize [51.21167546843708]
共同設立者(データ分散とモデルキャパシティ)の制御により,公正な介入による一般化が向上することを示す。
この知見を応用して, 逆正当性重み付けとサブグループワイド特徴正規化を併用し, 新たなアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・インセンティブ・インターベンション・インベンション・インテクション(DAID)を提案する。
DAIDは、いくつかの最先端技術と比較して、公平性と一般化の両方において一貫して優れた性能を達成する
論文 参考訳(メタデータ) (2025-07-03T14:10:02Z) - Continuous Evolution Pool: Taming Recurring Concept Drift in Online Time Series Forecasting [58.448663215248565]
継続的進化プール(Continuous Evolution Pool, CEP)は、異なる概念の予測器のインスタンスを格納するプール機構である。
CEPは、様々な概念の知識を効果的に保持する。
オンライン予測と繰り返し概念のシナリオでは,CEPは予測結果を著しく向上させる。
論文 参考訳(メタデータ) (2025-05-28T03:27:49Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Online Drift Detection with Maximum Concept Discrepancy [13.48123472458282]
最大概念差に基づく新しい概念ドリフト検出手法であるMDD-DDを提案する。
本手法は,概念埋め込みのコントラスト学習により,様々な形態のコンセプトドリフトを適応的に同定することができる。
論文 参考訳(メタデータ) (2024-07-07T13:57:50Z) - A comprehensive analysis of concept drift locality in data streams [3.5897534810405403]
概念ドリフトは、進化するデータ特性への効果的なモデル適応のために検出されなければならない。
本稿では,その局所性とスケールに基づいて,概念ドリフトの新たな分類法を提案する。
我々は, 様々な難易度において, 9つの最先端ドリフト検出器の比較評価を行った。
論文 参考訳(メタデータ) (2023-11-10T20:57:43Z) - Federated Learning under Distributed Concept Drift [30.069809537266575]
分散コンセプトドリフト下でのフェデレートラーニング(FL)は、ほとんど探索されていない分野である。
まず, ドリフト適応に対する先行解が, 単一のグローバルモデルで, 停滞するドリフトに不適であることを実証した。
局所的ドリフト検出と階層的クラスタリングに基づくドリフトに反応する2つの新しいクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-01T23:55:21Z) - Exploring the Trade-off between Plausibility, Change Intensity and
Adversarial Power in Counterfactual Explanations using Multi-objective
Optimization [73.89239820192894]
自動対物生成は、生成した対物インスタンスのいくつかの側面を考慮すべきである。
本稿では, 対実例生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-20T15:02:53Z) - Multivariate Deep Evidential Regression [77.34726150561087]
不確実性を認識するニューラルネットワークによる新しいアプローチは、従来の決定論的手法よりも有望である。
本稿では,レグレッションベースニューラルネットワークからアレータ性およびてんかん性不確かさを抽出する手法を提案する。
論文 参考訳(メタデータ) (2021-04-13T12:20:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。