論文の概要: ExDBSCAN: Explaining DBSCAN with Counterfactual Reasoning -- Additional Material
- arxiv url: http://arxiv.org/abs/2605.30225v2
- Date: Tue, 02 Jun 2026 09:02:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 18:57:50.169099
- Title: ExDBSCAN: Explaining DBSCAN with Counterfactual Reasoning -- Additional Material
- Title(参考訳): ExDBSCAN:DBSCANを非現実的推論で説明する -- 追加材料
- Authors: Pernille Matthews, Lena Krieger, Tommaso Amico, Artur Zimek, Thomas Seidl, Ira Assent,
- Abstract要約: クラスタリングは、類似性によってデータポイントをグループ化する、教師なしのテクニックである。
ExDBSCANは、理論的に妥当性が保証される、実用的な対実的な説明を提供する。
- 参考スコア(独自算出の注目度): 8.841415312880686
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering is an unsupervised technique for grouping data points by similarity. While explainability methods exist for supervised machine learning, they are not directly applicable to clustering, making it challenging to understand cluster assignments. This interpretability gap is particularly evident in the popular density-based method DBSCAN, which assigns points as inliers (cluster members in dense regions) or outliers (noise points in sparse regions). DBSCAN does not provide insight into why a particular point receives its assignment or whether its assignment is robust to small changes in the data. To address the lack of explainability, we introduce ExDBSCAN, a density-aware, post-hoc explanation method. ExDBSCAN offers actionable counterfactual explanations, with theoretical guarantees for validity. It generates multiple counterfactuals using a density connected weighted graph, adopting a physics-inspired model that repels counterfactual candidates from one another (diversity), while pulling them toward the instance to explain (proximity). Empirical evaluation on 30 tabular datasets comparing against four baselines shows that ExDBSCAN outperforms all baselines while attaining perfect validity and retrieving diverse, proximal counterfactuals.
- Abstract(参考訳): クラスタリングは、類似性によってデータポイントをグループ化する、教師なしのテクニックである。
教師あり機械学習には説明可能性の方法があるが、クラスタリングには直接適用されないため、クラスタ割り当てを理解することは困難である。
この解釈可能性ギャップは、一般的な密度に基づくDBSCAN法(英語版)において特に顕著であり、これは点をinlier(高密度領域のクラスタメンバー)またはoutlier(スパース領域のノイズポイント)として割り当てるものである。
DBSCANは、特定のポイントがその割り当てを受けた理由や、その割り当てがデータの小さな変更に対して堅牢であるかどうかについての洞察を提供していない。
説明可能性の欠如に対処するため,密度を考慮したポストホックな説明法であるExDBSCANを導入する。
ExDBSCANは、理論的に妥当性が保証される、実用的な対実的な説明を提供する。
密度連結重み付きグラフを用いて複数の反ファクトを生成し、物理にインスパイアされたモデルを用いて、反ファクト的候補を互いに再現し(多様性)、それらを説明のためにインスタンスに向かって引き寄せる(近さ)。
4つのベースラインと比較した30の表状データセットの実証評価の結果,ExDBSCANは全ベースラインを上回り,完全妥当性を達成し,多種多様で近縁なカウンターファクトの検索を行うことができた。
関連論文リスト
- Weight-Informed Self-Explaining Clustering for Mixed-Type Tabular Data [63.62853416081748]
WISEは表現、特徴重み付け、クラスタリング、解釈を統一するフレームワークである。
クラスタリングを駆動する同じプリミティブに根ざした、忠実で人間解釈可能な説明を生成する。
論文 参考訳(メタデータ) (2026-04-07T13:18:31Z) - THESAURUS: Contrastive Graph Clustering by Swapping Fused Gromov-Wasserstein Couplings [9.805171821491207]
We present conTrastive grapH clustEring by SwApping fUsed gRomov-wasserstein couplingS (THESAURUS)
本手法では,コンテキスト情報を提供するためのセマンティックプロトタイプを導入し,クロスビュー代入予測プレテキストタスクを採用する。
これはGromov-Wasserstein Optimal Transport (GW-OT) と提案したプロトタイプグラフを利用して、グラフ構造のクラスタ情報を徹底的に活用する。
論文 参考訳(メタデータ) (2024-12-16T08:33:56Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Don't Explain Noise: Robust Counterfactuals for Randomized Ensembles [50.81061839052459]
我々は確率論的問題として、堅牢な対実的説明の生成を定式化する。
アンサンブルモデルのロバスト性とベース学習者のロバスト性との関係を示す。
本手法は, 反実的説明から初期観測までの距離をわずかに増加させるだけで, 高いロバスト性を実現する。
論文 参考訳(メタデータ) (2022-05-27T17:28:54Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Robust Self-Supervised Convolutional Neural Network for Subspace
Clustering and Classification [0.10152838128195464]
本稿では,自己管理型畳み込みサブスペースクラスタリングネットワーク(S2$ConvSCN)のロバストな定式化を提案する。
真の教師なしのトレーニング環境では、Robust $S2$ConvSCNは、4つのよく知られたデータセットで見られるデータと見えないデータの両方に対して、ベースラインバージョンをかなり上回っている。
論文 参考訳(メタデータ) (2020-04-03T16:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。