論文の概要: Comprehensible Counterfactual Explanation on Kolmogorov-Smirnov Test
- arxiv url: http://arxiv.org/abs/2011.01223v2
- Date: Fri, 16 Apr 2021 01:23:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:38:12.698259
- Title: Comprehensible Counterfactual Explanation on Kolmogorov-Smirnov Test
- Title(参考訳): Kolmogorov-Smirnov 試験の総合的解析
- Authors: Zicun Cong, Lingyang Chu, Yu Yang, Jian Pei
- Abstract要約: 我々は,KSテストに失敗するテストデータに対して,反実的説明を生成する問題に対処する。
我々は、KSテストに失敗したテストセットの指数的なサブセット数を列挙し、チェックするのを避ける効率的なアルゴリズムMOCHEを開発した。
- 参考スコア(独自算出の注目度): 56.5373227424117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Kolmogorov-Smirnov (KS) test is popularly used in many applications, such
as anomaly detection, astronomy, database security and AI systems. One
challenge remained untouched is how we can obtain an explanation on why a test
set fails the KS test. In this paper, we tackle the problem of producing
counterfactual explanations for test data failing the KS test. Concept-wise, we
propose the notion of most comprehensible counterfactual explanations, which
accommodates both the KS test data and the user domain knowledge in producing
explanations. Computation-wise, we develop an efficient algorithm MOCHE (for
MOst CompreHensible Explanation) that avoids enumerating and checking an
exponential number of subsets of the test set failing the KS test. MOCHE not
only guarantees to produce the most comprehensible counterfactual explanations,
but also is orders of magnitudes faster than the baselines. Experiment-wise, we
present a systematic empirical study on a series of benchmark real datasets to
verify the effectiveness, efficiency and scalability of most comprehensible
counterfactual explanations and MOCHE.
- Abstract(参考訳): Kolmogorov-Smirnov (KS) テストは、異常検出、天文学、データベースセキュリティ、AIシステムなど、多くのアプリケーションで広く使われている。
未修正の課題のひとつは、テストセットがなぜksテストに失敗したのかを説明する方法だ。
本稿では,KSテストに失敗するテストデータに対して,逆実効的な説明を生成する問題に取り組む。
概念的には,KSテストデータとユーザドメイン知識の両方に対応可能な,最も理解可能な対実的説明の概念を提案する。
KSテストに失敗したテストセットの指数的なサブセット数を列挙してチェックするのを避ける効率的なアルゴリズムMOCHE(MOst CompreHensible Explanation)を開発した。
MOCHEは、最も理解可能なカウンターファクトの説明を生成することを保証するだけでなく、ベースラインよりも桁違いに高速である。
実験では,一連のベンチマーク実データに対して,最も理解しやすい反現実的説明とMOCHEの有効性,効率,スケーラビリティを検証した。
関連論文リスト
- MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs [80.96119560172224]
大規模言語モデル(LLM)は、高い精度で算術語問題を解くことができるが、訓練された言語よりも複雑な問題にどのように一般化するかは、ほとんど分かっていない。
本研究では、任意に複雑な算術証明問題に対する LLM の評価フレームワーク、MathGAP を提案する。
論文 参考訳(メタデータ) (2024-10-17T12:48:14Z) - Provably Neural Active Learning Succeeds via Prioritizing Perplexing Samples [53.95282502030541]
ニューラルネットワークベースのアクティブラーニング(NAL)は、ニューラルネットワークを使用してサンプルの小さなサブセットを選択してトレーニングする、費用対効果の高いデータ選択技術である。
我々は、機能学習の観点から、両方のクエリ基準ベースのNALの成功について、統一的な説明を提供することにより、一歩前進させようとする。
論文 参考訳(メタデータ) (2024-06-06T10:38:01Z) - Sanity Checks for Explanation Uncertainty [6.9060054915724]
機械学習モデルの説明は解釈し難いり、間違っていたりすることがある。
本研究では,不確実性のある説明のために,重みとデータランダム化テストを定義した不確実性説明のための正当性チェックを提案する。
CIFAR10およびCalifornia Housingデータセットにおけるこれらの試験の有効性と有効性について実験的に検討した。
論文 参考訳(メタデータ) (2024-03-25T21:39:33Z) - Membership Testing in Markov Equivalence Classes via Independence Query
Oracles [17.84347390320128]
因果関係を学習するよりも、因果関係をテストする方が比較的容易であることを示す。
特に、高いin-degreeと小さなcliqueサイズを特徴とするグラフにおいて、指数関数的に低い独立性テストが必要である。
論文 参考訳(メタデータ) (2024-03-09T02:10:08Z) - Optimal Decision Tree and Adaptive Submodular Ranking with Noisy Outcomes [9.321976218862542]
プールベースのアクティブラーニングでは、学習者にラベルのないデータセットが与えられ、データポイントのラベルをクエリすることで未知の仮説を効率的に学習することを目的としている。
これは古典的最適決定木(ODT)問題として定式化できる: テストのセット、仮説のセット、各テストと仮説に対する結果が与えられた場合、我々の目標は、真の仮説を識別する低コストなテスト手順(すなわち決定木)を見つけることである。
本研究では,ODT問題の基本的変種について検討し,実験結果がうるさい場合,さらに一般的な場合であっても検討する。
論文 参考訳(メタデータ) (2023-12-23T21:47:50Z) - PARs: Predicate-based Association Rules for Efficient and Accurate
Model-Agnostic Anomaly Explanation [2.280762565226767]
述語型アソシエーションルール(PAR)を用いた効率的かつ正確なモデル非依存的異常説明のための新しいアプローチを提案する。
ユーザ調査により, PARの異常説明形式は, 通常の異常検出システムではよりよく理解され, 好まれることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-18T06:45:31Z) - Understanding and Mitigating Classification Errors Through Interpretable
Token Patterns [58.91023283103762]
容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。
正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。
提案手法であるPremiseが実際によく動作することを示す。
論文 参考訳(メタデータ) (2023-11-18T00:24:26Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Don't Explain Noise: Robust Counterfactuals for Randomized Ensembles [50.81061839052459]
我々は確率論的問題として、堅牢な対実的説明の生成を定式化する。
アンサンブルモデルのロバスト性とベース学習者のロバスト性との関係を示す。
本手法は, 反実的説明から初期観測までの距離をわずかに増加させるだけで, 高いロバスト性を実現する。
論文 参考訳(メタデータ) (2022-05-27T17:28:54Z) - Recursive Causal Structure Learning in the Presence of Latent Variables
and Selection Bias [27.06618125828978]
本稿では,潜伏変数と選択バイアスの存在下での観測データからシステムの因果MAGを学習する問題を考察する。
本稿では,音と完全性を備えた計算効率のよい制約ベースの新しい手法を提案する。
提案手法と人工と実世界の両方の構造に関する技術の現状を比較した実験結果を提供する。
論文 参考訳(メタデータ) (2021-10-22T19:49:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。