論文の概要: Metamorphic Testing with the Rashomon Set: Explanation Faithfulness in Machine Learning
- arxiv url: http://arxiv.org/abs/2606.06056v1
- Date: Thu, 04 Jun 2026 11:57:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.769145
- Title: Metamorphic Testing with the Rashomon Set: Explanation Faithfulness in Machine Learning
- Title(参考訳): 羅生門集合を用いた変成テスト:機械学習における説明的信条
- Authors: Helge Spieker, Jørn Eirik Betten, Arnaud Gotlieb,
- Abstract要約: 複数の機械学習モデルは、同じタスクでほぼ等価な予測性能を達成できるが、異なる特徴ベースの説明を提供する。
これは(説明可能な)機械学習の羅生門効果と呼ばれ、どの説明が信頼できるかという疑問を提起する。
そこで本稿では,地味なラベルを必要とせず,説明の忠実さを評価するメタモルフィックテストに基づくフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.570003973862485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiple machine learning models can achieve near-equivalent predictive performance on the same task, yet provide divergent feature-based explanations. This is called the Rashomon effect of (explainable) machine learning, and it raises the question of which explanations, if any, are trustworthy. We propose a framework based on metamorphic testing that assesses explanation faithfulness without requiring ground-truth labels by exploring attributed feature importance from post-hoc explanation methods. Five metamorphic relations formalize expected consistency properties between model behavior and feature attributions. We apply this general framework to two tabular regression datasets and two post-hoc explainers (SHAP and LIME) to demonstrate the approach. The framework offers a practical, model-agnostic tool for selecting accurate models with reliable and trustworthy explanations.
- Abstract(参考訳): 複数の機械学習モデルは、同じタスクでほぼ等価な予測性能を達成できるが、異なる特徴ベースの説明を提供する。
これは(説明可能な)機械学習の羅生門効果と呼ばれ、どの説明が信頼できるかという疑問を提起する。
本稿では,ポストホックな説明手法から特徴量の重要性を探求し,地味なラベルを必要とせず,説明の忠実さを評価するメタモルフィックテストに基づくフレームワークを提案する。
5つのメタモルフィック関係は、モデル挙動と特徴属性の間の期待された一貫性特性を形式化する。
この一般的なフレームワークを2つの表付き回帰データセットと2つのポストホック説明器(SHAPとLIME)に適用し、このアプローチを実証する。
このフレームワークは、信頼性と信頼性のある説明で正確なモデルを選択するための実用的で、モデルに依存しないツールを提供する。
関連論文リスト
- Evaluating Local Explainability Metrics for Machine Learning Models on Tabular Data [1.423280626666929]
説明は人間に当てはまるが、モデルの内部的推論を捉えられない。
本稿では,複雑な表表分類タスクに適用した場合の局所的説明可能性手法の信頼性について検討する。
論文 参考訳(メタデータ) (2026-05-26T19:38:10Z) - Why Does It Look There? Structured Explanations for Image Classification [31.62439146845817]
Interpretability to Explainability (I2X)は、構造化されていない解釈可能性から直接構造化された説明を構築するフレームワークである。
I2Xは、異なるモデルアーキテクチャとデータセット間の予測を改善するために使用できることを示す。
論文 参考訳(メタデータ) (2026-03-10T21:15:14Z) - Does the Model Say What the Data Says? A Simple Heuristic for Model Data Alignment [0.0]
機械学習モデルが学習したデータ構造と一致しているかを評価するためのフレームワークを提案する。
モデル動作を説明することのみに焦点を当てた既存の解釈可能性メソッドとは異なり、我々のアプローチはデータ自体から直接派生したベースラインを確立する。
論文 参考訳(メタデータ) (2025-11-26T21:44:55Z) - Explainability for Machine Learning Models: From Data Adaptability to
User Perception [0.8702432681310401]
この論文は、すでにデプロイされた機械学習モデルに対する局所的な説明の生成を探求する。
データとユーザ要件の両方を考慮して、意味のある説明を生み出すための最適な条件を特定することを目的としている。
論文 参考訳(メタデータ) (2024-02-16T18:44:37Z) - Discriminative Feature Attributions: Bridging Post Hoc Explainability
and Inherent Interpretability [29.459228981179674]
ポストホックの説明は、基礎となるタスクにとって重要でない、あるいは差別的でない機能に、誤って高い重要性がある。
一方、モデルアーキテクチャに説明を明示的にエンコードすることでこれらの問題を回避することができる。
本研究では,ディストラクタ消去に頑健なブラックボックスモデルを適応させる手法であるディストラクタ消去調整法(DiET)を提案する。
論文 参考訳(メタデータ) (2023-07-27T17:06:02Z) - On the Joint Interaction of Models, Data, and Features [82.60073661644435]
本稿では,データとモデル間の相互作用を実験的に解析する新しいツールであるインタラクションテンソルを紹介する。
これらの観測に基づいて,特徴学習のための概念的枠組みを提案する。
この枠組みの下では、一つの仮説に対する期待された精度と一対の仮説に対する合意はどちらも閉形式で導出することができる。
論文 参考訳(メタデータ) (2023-06-07T21:35:26Z) - Learning with Explanation Constraints [91.23736536228485]
我々は、説明がモデルの学習をどのように改善するかを分析するための学習理論フレームワークを提供する。
我々は,多数の合成および実世界の実験に対して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T15:06:47Z) - Explainability in Process Outcome Prediction: Guidelines to Obtain
Interpretable and Faithful Models [77.34726150561087]
本稿では、プロセス結果予測の分野における説明可能性モデルと説明可能性モデルの忠実性を通して、説明可能性を定義する。
本稿では,イベントログの仕様に基づいて適切なモデルを選択することのできる,X-MOPというガイドラインのセットを提案する。
論文 参考訳(メタデータ) (2022-03-30T05:59:50Z) - Partial Order in Chaos: Consensus on Feature Attributions in the
Rashomon Set [50.67431815647126]
ポストホックなグローバル/ローカルな特徴属性法は、機械学習モデルを理解するために徐々に採用されている。
この手法により局所的・言語的特徴の半順序が生じることを示す。
これらの部分的な順序に現れる特徴間の関係は、既存のアプローチによって提供されたランクにも当てはまることを示す。
論文 参考訳(メタデータ) (2021-10-26T02:53:14Z) - Beyond Trivial Counterfactual Explanations with Diverse Valuable
Explanations [64.85696493596821]
コンピュータビジョンの応用において、生成的対実法はモデルの入力を摂動させて予測を変更する方法を示す。
本稿では,多様性強化損失を用いて制約される不連続潜在空間における摂動を学習する反事実法を提案する。
このモデルは, 従来の最先端手法と比較して, 高品質な説明を生産する成功率を向上させる。
論文 参考訳(メタデータ) (2021-03-18T12:57:34Z) - Deducing neighborhoods of classes from a fitted model [68.8204255655161]
本稿では,新しいタイプの解釈可能な機械学習手法を提案する。
量子シフトを用いた分類モデルでは、特徴空間の予測クラスへの分割を理解するのに役立ちます。
基本的に、実際のデータポイント(または特定の関心点)を使用し、特定の特徴をわずかに引き上げたり減少させたりした後の予測の変化を観察する。
論文 参考訳(メタデータ) (2020-09-11T16:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。