論文の概要: GRANITE: A Generalized Regional Framework for Identifying Agreement in Feature-Based Explanations
- arxiv url: http://arxiv.org/abs/2601.22771v1
- Date: Fri, 30 Jan 2026 09:49:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.363832
- Title: GRANITE: A Generalized Regional Framework for Identifying Agreement in Feature-Based Explanations
- Title(参考訳): GRANITE: 特徴に基づく説明における合意の特定のための一般化された地域枠組み
- Authors: Julia Herbinger, Gabriel Laberge, Maximilian Muschalik, Yann Pequignot, Marvin N. Wright, Fabian Fumagalli,
- Abstract要約: 特徴に基づく説明法は、機能がモデルの振る舞いにどのように影響するかを、局所的またはグローバル的に定量化することを目的としているが、異なる方法はしばしば一致しない。
本稿では,特徴空間を相互作用や分布の影響を最小限に抑える領域に分割する一般化された地域説明フレームワークを提案する。
実世界のデータセット上での有効性を実証し、一貫性と解釈可能な特徴説明のための実用的なツールを提供する。
- 参考スコア(独自算出の注目度): 10.111546558028271
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature-based explanation methods aim to quantify how features influence the model's behavior, either locally or globally, but different methods often disagree, producing conflicting explanations. This disagreement arises primarily from two sources: how feature interactions are handled and how feature dependencies are incorporated. We propose GRANITE, a generalized regional explanation framework that partitions the feature space into regions where interaction and distribution influences are minimized. This approach aligns different explanation methods, yielding more consistent and interpretable explanations. GRANITE unifies existing regional approaches, extends them to feature groups, and introduces a recursive partitioning algorithm to estimate such regions. We demonstrate its effectiveness on real-world datasets, providing a practical tool for consistent and interpretable feature explanations.
- Abstract(参考訳): 特徴に基づく説明法は、機能がどのようにモデルの振る舞いに影響を及ぼすかを、局所的またはグローバル的に定量化することを目的としているが、異なる方法はしばしば矛盾し、矛盾する説明を生み出している。
この意見の相違は、主に2つのソースから生じている。
GRANITEは、特徴空間を相互作用と分布の影響を最小限に抑える領域に分割する一般化された地域説明フレームワークである。
このアプローチは異なる説明法を整合させ、より一貫性があり解釈可能な説明を与える。
GRANITEは既存の地域アプローチを統合し、特徴グループに拡張し、そのような領域を推定するために再帰的分割アルゴリズムを導入する。
実世界のデータセット上での有効性を実証し、一貫性と解釈可能な特徴説明のための実用的なツールを提供する。
関連論文リスト
- Towards Fine-Grained Interpretability: Counterfactual Explanations for Misclassification with Saliency Partition [50.68751788132789]
本稿では,オブジェクトレベルと部分レベルの両方の解釈可能性を生成する,ファクトファクトファクトの詳細な説明フレームワークを提案する。
本手法は, 類似性を定量化し, 成分の重み付けを行うことにより, 非生成的な説明可能な反事実を与える。
論文 参考訳(メタデータ) (2025-11-11T08:38:38Z) - Unifying Feature-Based Explanations with Functional ANOVA and Cooperative Game Theory [21.405333804566357]
局所的およびグローバルな特徴に基づく説明のための統一的なフレームワークを導入する。
特徴分布の影響を決定する3つのfANOVA分解を導入する。
次に、合成および実世界のデータセットにおけるフレームワークの有用性を実証的に示す。
論文 参考訳(メタデータ) (2024-12-22T20:12:16Z) - GLEAMS: Bridging the Gap Between Local and Global Explanations [6.329021279685856]
本稿では,入力空間を分割し,各サブリージョン内で解釈可能なモデルを学習する新しい手法であるGLEAMSを提案する。
我々は、GLEAMSが合成データと実世界のデータの両方で有効であることを示し、その望ましい特性と人間の理解可能な洞察を強調した。
論文 参考訳(メタデータ) (2024-08-09T13:30:37Z) - Decomposing Global Feature Effects Based on Feature Interactions [10.874932625841257]
グローバルエフェクトの一般化付加分解(GADGET)は特徴空間の解釈可能な領域を見つけるための新しいフレームワークである。
フレームワークの数学的基盤を提供し、限界特徴効果を可視化する最も一般的な手法に適用可能であることを示す。
提案手法の理論的特性を,異なる実験環境における様々な特徴効果法に基づいて実験的に評価した。
論文 参考訳(メタデータ) (2023-06-01T10:51:12Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - Partial Order in Chaos: Consensus on Feature Attributions in the
Rashomon Set [50.67431815647126]
ポストホックなグローバル/ローカルな特徴属性法は、機械学習モデルを理解するために徐々に採用されている。
この手法により局所的・言語的特徴の半順序が生じることを示す。
これらの部分的な順序に現れる特徴間の関係は、既存のアプローチによって提供されたランクにも当てはまることを示す。
論文 参考訳(メタデータ) (2021-10-26T02:53:14Z) - Variational Disentanglement for Domain Generalization [68.85458536180437]
本稿では,変分拡散ネットワーク(VDN)という効果的なフレームワークを提供することにより,領域一般化の課題に取り組むことを提案する。
VDNは、ドメイン固有の機能とタスク固有の機能を切り離し、タスク固有のフィーチャは、見えないが関連するテストデータにより良い一般化が期待できる。
論文 参考訳(メタデータ) (2021-09-13T09:55:32Z) - Adversarial Graph Representation Adaptation for Cross-Domain Facial
Expression Recognition [86.25926461936412]
本稿では,グラフ表現の伝播と逆学習を両立させる新しいAdrialversa Graph Representation Adaptation (AGRA) フレームワークを提案する。
提案するAGRAフレームワークは,従来の最先端手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-08-03T13:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。