論文の概要: Fairness of Explanations in Artificial Intelligence (AI): A Unifying Framework, Axioms, and Future Direction toward Responsible AI
- arxiv url: http://arxiv.org/abs/2605.09852v1
- Date: Mon, 11 May 2026 01:09:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.452184
- Title: Fairness of Explanations in Artificial Intelligence (AI): A Unifying Framework, Axioms, and Future Direction toward Responsible AI
- Title(参考訳): 人工知能(AI)における説明の公正性 : 統一フレームワーク,公理,そして責任あるAIへの今後の方向性
- Authors: Gideon Popoola, John Sheppard,
- Abstract要約: 機械学習アルゴリズムは、刑事司法、医療、信用、雇用など、高度な意思決定に使われている。
研究コミュニティは2つの独立した研究分野に答えている: インペラルゴリトミックフェアネス(英語版)、そして解釈可能な推論をターゲットとする説明可能なAI(英語版)(XAI)である。
この調査は、その交点における新しい盲点を特定し、マッピングする。これは、そのアウトプットにおける標準フェアネス基準をすべて満たし、そのエンフェレゾン化過程において極めて不公平であるモデルである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Machine learning algorithms are being used in high-stakes decisions, including those in criminal justice, healthcare, credit, and employment. The research community has responded with two largely independent research fields: \emph{algorithmic fairness}, which targets equitable outcomes, and \emph{explainable AI} (XAI), which targets interpretable reasoning. This survey identifies and maps a novel blind spot at their intersection, which is a model that can satisfy every standard fairness criterion in its outputs while being profoundly unfair in its \emph{reasoning process}. We refer to this as the procedural bias, and mitigating it requires treating the fairness of explanations as a distinct object of scientific study. To our knowledge, we provide the first unified theoretical and literature review of this emerging field and elucidate the drawbacks of post-hoc explainers in certifying explanation fairness. Our central contribution is a \emph{conditional invariance framework} formalizing explanation fairness as the requirement that explanations should be indifferent regardless of the protected attributes $ P(E(X) \in \cdot \mid X_\text{rel} = x_\text{rel},\, A = a) = P(E(X) \in \cdot \mid X_\text{rel} = x_\text{rel},\, A = b)$ for all task-relevant $x$, a single principle from which all existing explanation fairness metrics emerge as partial operationalizations. We introduce a seven-dimensional taxonomy, identify three generative mechanisms of explanation inequity (representation-driven, explanation-model mismatch, actionability-driven), and propose a canonical six-step evaluation workflow for operationalizing explanation fairness audits in practice.
- Abstract(参考訳): 機械学習アルゴリズムは、刑事司法、医療、信用、雇用など、高度な意思決定に使われている。
研究コミュニティは、公平な成果を目標とする「emph{algorithmic fairness}」と、解釈可能な推論をターゲットとする「emph{explainable AI}」(XAI)の2つの大きく独立した研究分野に回答している。
このサーベイは、その交点における新しい盲点を特定し、マッピングする。これは、その出力における標準公正基準をすべて満たし、かつ、その 'emph{reasoning} プロセスにおいて極めて不公平であるモデルである。
我々はこれを手続き的バイアスと呼び、それを緩和するには説明の公正性を科学研究の別の対象として扱う必要がある。
本研究は,本分野の統一的理論的,文献的考察を行い,説明公正性を証明する上でのポストホック解説者の欠点を解明するものである。
我々の中心的な貢献は、説明フェアネスを、保護された属性にかかわらず説明が無関心であるという要件として定式化する \emph{conditional invariance framework} である。
a) = P(E(X) \in \cdot \mid X_\text{rel} = x_\text{rel},\, A =
b)すべてのタスク関連$x$に対して、既存の説明公正度指標が部分的運用化として出現する単一の原則。
本研究では,7次元分類法を導入し,説明不等式(表現駆動型,説明モデルミスマッチ,行動可能性駆動型)の3つの生成機構を同定し,実際に説明公正監査を行うための6段階評価ワークフローを提案する。
関連論文リスト
- How can we trust opaque systems? Criteria for robust explanations in XAI [0.0]
ディープラーニング(DL)アルゴリズムは、日常生活や科学研究においてユビキタスになりつつある。
DLシステムが提供するデータの特徴や、最終的に正しいアウトプットを予測するのにどのように成功するのかは、一般の人々や研究者にはよく分かっていない。
信頼できる説明に必要な基準は、アルゴリズムの予測がベースとしている関連するプロセスを反映すべきであるということである。
論文 参考訳(メタデータ) (2025-08-18T04:38:55Z) - Explainable Evidential Clustering [0.0]
実世界のデータは、しばしば不完全であり、不確かさと不正確さが特徴であり、従来の手法ではうまく扱えない。
Dempster-Shafer理論に基づくエビデンシャルクラスタリングは、これらの課題に対処する。
本稿では,解釈可能かつ慎重な決定木説明を提供するIEMM (Iterative Evidential Mistake Minimization) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-07-16T12:44:25Z) - Evaluating Human Alignment and Model Faithfulness of LLM Rationale [66.75309523854476]
大規模言語モデル(LLM)が,その世代を理論的にどのように説明するかを考察する。
提案手法は帰属に基づく説明よりも「偽り」が少ないことを示す。
論文 参考訳(メタデータ) (2024-06-28T20:06:30Z) - On the Interplay between Fairness and Explainability [28.37896468795247]
公平さと説明責任が相互にどのように影響するかを理解するための最初の研究を行う。
バイアス軽減のためのいくつかの手法を用いて、事前学習した言語モデルを微調整する。
バイアス緩和アルゴリズムは必ずしもより公平なモデルに繋がらない。
論文 参考訳(メタデータ) (2023-10-25T12:59:51Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and
Execution [97.50813120600026]
時空間推論は人工知能(AI)の課題である
最近の研究は、この種の抽象的推論タスクに焦点を当てている -- Raven's Progressive Matrices (RPM)
ニューロシンボリックな確率的アブダクションと実行学習者(PrAE)を提案する。
論文 参考訳(メタデータ) (2021-03-26T02:42:18Z) - Contrastive Explanations for Model Interpretability [77.92370750072831]
分類モデルの対照的説明を生成する手法を提案する。
本手法は潜在空間へのモデル表現の投影に基づいている。
本研究は,モデル決定のより正確できめ細かな解釈性を提供するためのラベルコントラスト的説明の能力に光を当てた。
論文 参考訳(メタデータ) (2021-03-02T00:36:45Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。