論文の概要: Stabilising Explainability Fragility in Cybersecurity AI: The Impact and Mitigation of Multicollinearity in Public Benchmark Datasets
- arxiv url: http://arxiv.org/abs/2605.22529v1
- Date: Thu, 21 May 2026 14:20:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.292094
- Title: Stabilising Explainability Fragility in Cybersecurity AI: The Impact and Mitigation of Multicollinearity in Public Benchmark Datasets
- Title(参考訳): サイバーセキュリティAIにおける説明可能性の脆弱性の安定化: 公開ベンチマークデータセットにおける多項性の影響と軽減
- Authors: Ioannis J. Vourganas, Anna Lito Michala,
- Abstract要約: 多重線型性は帰属分散を膨らませるという公式な定理を導入する。
線形、ツリーベース、カーネル、ニューラルの4つのモデルが、フルおよびプルーニングされた機能セットで評価されている。
本稿では,説明可能性の脆弱性スコア(Explainability Fragility Score)の新たな指標と,拡張複雑性を緩和する2つの新しい手法を提案する。
- 参考スコア(独自算出の注目度): 1.1172382217477128
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper investigates a unexplored yet impactful vulnerability in AI explainability used in intrusion detection (IDS): multicollinearity-induced instability. Despite extensive reliance on post-hoc explainability tools such as SHAP or LIME, the impact of correlated features on explanation robustness is not evaluated. We introduce a formal theorem stating that multicollinearity inflates attribution variance. This demonstrates that explanations and feature importances are non-identifiable under multicollinearity. A suite of comprehensive experiments validates the theorem on a representative benchmark dataset, UNSW-NB15. Four widely used families of models are evaluated, including linear, tree-based, kernel, and neural, across full and pruned feature sets based on VIF and correlation thresholding. We propose the novel metric of Explanability Fragility Score and two novel methods to mitigate it with variable integration complexity. CAA-Filtering focuses on stabilising explanations by grouping attributions of trained models. SHARP is a novel training-time regularisation framework that penalises attribution instability, enabling controllable and monotonic improvement of explainability stability. The findings support stable predictive performance, using Kendall's τ to quantify instability across bootstrapped explanations. This work has direct implications for the trustworthiness and reproducibility of XAI in security-critical contexts, and motivates incorporating multicollinearity mitigations into the IDS pipelines, providing a set of guidelines for practitioners.
- Abstract(参考訳): 本稿では、侵入検知(IDS)におけるAI説明可能性の未解明かつ影響のある脆弱性について検討する。
SHAPやLIMEのようなポストホックな説明可能性ツールに大きく依存しているにもかかわらず、相関した特徴が説明の堅牢性に与える影響は評価されていない。
多重線型性は帰属分散を膨らませるという公式な定理を導入する。
これは、マルチコリニティの下では説明と特徴の重要性が識別できないことを示している。
一連の包括的な実験は、この定理を代表ベンチマークデータセットUNSW-NB15で検証する。
線形、木ベース、カーネル、ニューラルを含む4種類のモデルが、VIFと相関しきい値に基づくフルおよびプルーニングされた特徴セットで評価されている。
本稿では,説明可能性の脆弱性スコア(Explainability Fragility Score)の新たな指標と,拡張複雑性を緩和する2つの新しい手法を提案する。
CAA-Filteringは、訓練されたモデルの属性をグループ化することで説明の安定化に焦点を当てている。
SHARPは、属性不安定を緩和し、説明可能性安定性の制御および単調な改善を可能にする、新しいトレーニング時間正規化フレームワークである。
この結果は、Kendallのτを用いて、ブートストラップされた説明の不安定性を定量化することで、安定した予測性能をサポートする。
この研究は、セキュリティクリティカルな文脈におけるXAIの信頼性と再現性に直接影響し、MDSパイプラインに複数のコリニティ緩和を組み込むことを動機付け、実践者のためのガイドラインのセットを提供する。
関連論文リスト
- Causal Parametric Drift Simulation: A Digital Twin Framework for Classifier Robustness Evaluation [0.0]
動的環境における機械学習の分類器は、コンセプトドリフトに直面している。
構造因果モデルを用いて既存のドリフト検出を補完するフレームワークをDigital Twinsとして提案する。
我々の手法であるCausal Parametric Drift Simulation, stress-tests classifications to identify vulnerabilities before deployment。
論文 参考訳(メタデータ) (2026-05-10T17:28:49Z) - Non-Parametric Rehearsal Learning via Conditional Mean Embeddings [88.89267783967263]
本研究では,不必要な未来(AUF)問題をテキスト化するための非パラメトリックリハーサル学習手法を提案する。
具体的には、カーネル機械を用いてAUFの目的を、動作誘起分布変化から所望性モデリングを遠ざける統一表現に再構成する。
論文 参考訳(メタデータ) (2026-05-09T15:30:52Z) - Towards Trustworthy Depression Estimation via Disentangled Evidential Learning [50.22167852149165]
EviDepはうつ病の重症度を共同で定量化する明らかな学習フレームワークである。
EviDepは、堅牢な証拠合成を保証するために厳密な情報整合性を強制する。
最先端の予測精度と優れた不確実性校正を実現し、信頼できる臨床スクリーニングのための堅牢なフェールセーフメカニズムを提供する。
論文 参考訳(メタデータ) (2026-04-17T13:27:11Z) - Reliable Explanations or Random Noise? A Reliability Metric for XAI [6.948460965107209]
本研究では、4つの信頼性公理の下で説明安定性を定量化する指標である説明信頼性指数(ERI)を紹介する。
ERIは、説明信頼性の原則的評価を可能にし、より信頼できるAI(XAI)システムをサポートする。
論文 参考訳(メタデータ) (2026-02-04T22:04:07Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - Explainability of Complex AI Models with Correlation Impact Ratio [10.61008729196936]
複雑なAIシステムはより良い予測を行うが、透明性が欠如し、信頼性、解釈可能性、安全なデプロイメントが制限されることが多い。
ExCIR(Explainability through correlation Impact Ratio)は,モデル出力に対する入力特徴の寄与を説明するための理論的基礎とシンプルで信頼性の高い指標である。
我々は,ExCIRが軽量なシングルパスの定式化により,相関した特徴から生じる依存関係をキャプチャすることを示した。
論文 参考訳(メタデータ) (2026-01-10T21:56:24Z) - Explainability-Guided Defense: Attribution-Aware Model Refinement Against Adversarial Data Attacks [6.573058520271728]
私たちは、トレーニング中に直接活用できる、解釈可能性と堅牢性との関連性を特定します。
本稿では,局所解釈可能なモデル非依存表現をアクティブな訓練信号に変換する属性誘導型改良フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-02T19:36:03Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Bridging Interpretability and Robustness Using LIME-Guided Model Refinement [0.0]
LIME(Local Interpretable Model-Agnostic Explanations)は、モデルロバスト性を体系的に強化する。
複数のベンチマークデータセットに対する実証的な評価は、LIME誘導の洗練は解釈可能性を改善するだけでなく、敵の摂動に対する耐性を著しく向上し、アウト・オブ・ディストリビューションデータへの一般化を促進することを示している。
論文 参考訳(メタデータ) (2024-12-25T17:32:45Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。