論文の概要: DCFO: Density-Based Counterfactuals for Outliers - Additional Material
- arxiv url: http://arxiv.org/abs/2512.10659v2
- Date: Thu, 18 Dec 2025 15:12:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 14:03:03.21848
- Title: DCFO: Density-Based Counterfactuals for Outliers - Additional Material
- Title(参考訳): DCFO: インダストリアルインダストリアルインダストリアルインダストリアルインダストリアルインダストリアル
- Authors: Tommaso Amico, Pernille Matthews, Lena Krieger, Arthur Zimek, Ira Assent,
- Abstract要約: 外乱検出は、データ分散の大部分から著しく逸脱するデータポイントを特定する。
既存のカウンターファクトな説明手法は、外れ値検出によって引き起こされる固有の課題を見落としている。
本稿では, 対物的説明を生成するために考案された新しい手法であるDCFO(Dedencience-based Counterfactuals for Outliers)を紹介する。
- 参考スコア(独自算出の注目度): 7.882014020392147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Outlier detection identifies data points that significantly deviate from the majority of the data distribution. Explaining outliers is crucial for understanding the underlying factors that contribute to their detection, validating their significance, and identifying potential biases or errors. Effective explanations provide actionable insights, facilitating preventive measures to avoid similar outliers in the future. Counterfactual explanations clarify why specific data points are classified as outliers by identifying minimal changes required to alter their prediction. Although valuable, most existing counterfactual explanation methods overlook the unique challenges posed by outlier detection, and fail to target classical, widely adopted outlier detection algorithms. Local Outlier Factor (LOF) is one the most popular unsupervised outlier detection methods, quantifying outlierness through relative local density. Despite LOF's widespread use across diverse applications, it lacks interpretability. To address this limitation, we introduce Density-based Counterfactuals for Outliers (DCFO), a novel method specifically designed to generate counterfactual explanations for LOF. DCFO partitions the data space into regions where LOF behaves smoothly, enabling efficient gradient-based optimisation. Extensive experimental validation on 50 OpenML datasets demonstrates that DCFO consistently outperforms benchmarked competitors, offering superior proximity and validity of generated counterfactuals.
- Abstract(参考訳): 外乱検出は、データ分散の大部分から著しく逸脱するデータポイントを特定する。
アウトリーチを説明することは、その検出に寄与する根底にある要因を理解し、その重要性を検証し、潜在的なバイアスやエラーを特定するために重要である。
効果的な説明は行動可能な洞察を与え、将来同様のアウトリーチを避けるための予防措置を促進する。
予測の変更に必要な最小限の変更を識別することで、特定のデータポイントが外れ値に分類される理由を明らかにする。
価値はあるものの、既存のカウンターファクト的説明法は、外れ値検出によって引き起こされる固有の課題を見逃し、古典的で広く採用されている外れ値検出アルゴリズムを標的にしなかった。
局所外乱係数 (LOF) は、相対的な局所密度によって外乱度を定量化する、最も一般的な教師なし外乱検出法の一つである。
LOFは様々なアプリケーションで広く使われているが、解釈性に欠ける。
この制限に対処するために、我々は、LOFの対実的説明を生成するために特別に設計された新しい手法である、密度に基づく対実的外乱法(DCFO)を導入する。
DCFOはデータ空間をLOFがスムーズに振る舞う領域に分割し、効率的な勾配ベースの最適化を可能にする。
50のOpenMLデータセットに対する大規模な実験的検証は、DCFOがベンチマークされた競合より一貫して優れており、生成されたカウンターファクトの近接性と妥当性が優れていることを示している。
関連論文リスト
- Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文 参考訳(メタデータ) (2025-01-06T12:35:51Z) - An Efficient Outlier Detection Algorithm for Data Streaming [51.56874851156008]
Local Outlier Factor (LOF)アルゴリズムのような従来の異常検出手法は、リアルタイムデータと競合する。
本稿では,オンライン異常検出におけるLOFアルゴリズムの効率向上のための新しい手法を提案し,EILOFアルゴリズムを提案する。
EILOFアルゴリズムは計算コストを大幅に削減するだけでなく、加算点数が増加すると検出精度を体系的に改善する。
論文 参考訳(メタデータ) (2025-01-02T05:12:43Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - IPOF: An Extremely and Excitingly Simple Outlier Detection Booster via
Infinite Propagation [30.91911545889579]
外部検出は、データマイニング分野で最も人気があり、継続的に増えているトピックの1つである。
本稿では,スコアに基づく外れ値検出カテゴリについて考察し,現在の外れ値検出アルゴリズムの性能は,スコア伝搬によってさらに向上する可能性があることを指摘する。
具体的には、無限伝播による極端かつエキサイティングに単純な外乱検出ブースターであるiPOFアルゴリズムの無限伝播を提案する。
論文 参考訳(メタデータ) (2021-08-01T03:48:09Z) - InFlow: Robust outlier detection utilizing Normalizing Flows [7.309919829856283]
正規化フローは、敵攻撃を含むアウトリーチを確実に検出できることを示す。
本手法では, トレーニングに外部データを必要としないため, OOD検出の効率性を示す。
論文 参考訳(メタデータ) (2021-06-10T08:42:50Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。