論文の概要: Aligning Faithful Interpretations with their Social Attribution
- arxiv url: http://arxiv.org/abs/2006.01067v3
- Date: Thu, 14 Jan 2021 18:54:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 05:55:15.526407
- Title: Aligning Faithful Interpretations with their Social Attribution
- Title(参考訳): 社会的帰属による忠実な解釈の調整
- Authors: Alon Jacovi, Yoav Goldberg
- Abstract要約: モデル解釈が忠実であることの要件はあいまいで不完全であることに気付く。
因果的帰属(因果的帰属)と解釈(社会的帰属)に対する人間の行動の帰属(因果的帰属)の相違が問題であると認識する。
- 参考スコア(独自算出の注目度): 58.13152510843004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We find that the requirement of model interpretations to be faithful is vague
and incomplete. With interpretation by textual highlights as a case-study, we
present several failure cases. Borrowing concepts from social science, we
identify that the problem is a misalignment between the causal chain of
decisions (causal attribution) and the attribution of human behavior to the
interpretation (social attribution). We re-formulate faithfulness as an
accurate attribution of causality to the model, and introduce the concept of
aligned faithfulness: faithful causal chains that are aligned with their
expected social behavior. The two steps of causal attribution and social
attribution together complete the process of explaining behavior. With this
formalization, we characterize various failures of misaligned faithful
highlight interpretations, and propose an alternative causal chain to remedy
the issues. Finally, we implement highlight explanations of the proposed causal
format using contrastive explanations.
- Abstract(参考訳): モデル解釈が忠実であることの要求は曖昧で不完全である。
テキストハイライトによる解釈をケーススタディとして,いくつかの障害事例を示す。
社会科学から概念を借用し、その問題は因果関係(因果帰属)と解釈(社会帰属)に対する人間の行動の帰属(社会帰属)の相違であると認識する。
我々は、モデルに対する因果関係の正確な帰属として忠実性を再定式化し、その期待された社会的行動と整合する忠実な因果連鎖の概念を導入する。
因果帰属と社会的帰属の2つのステップは、行動を説明するプロセスを完成させる。
この形式化により、不整合なハイライト解釈の様々な失敗を特徴づけ、問題を治療するための代替因果連鎖を提案する。
最後に,提案する因果形式の強調説明を対比説明を用いて実装する。
関連論文リスト
- Towards Faithful Natural Language Explanations: A Study Using Activation Patching in Large Language Models [29.67884478799914]
大きな言語モデル(LLM)は、その答えを正当化するために説得力のある自然言語説明(NLE)を生成することができる。
近年,NLEの忠実度を測定するための様々な手法が提案されている。
これらのアプローチは、確立された忠実性の定義に従って包括的でも正しくも設計されていない、と我々は主張する。
論文 参考訳(メタデータ) (2024-10-18T03:45:42Z) - The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning [70.16523526957162]
常識の因果関係を理解することは、人々が現実世界の原理をよりよく理解するのに役立ちます。
その重要性にもかかわらず、このトピックの体系的な探索は特に欠落している。
本研究の目的は、体系的な概要の提供、最近の進歩に関する学者の更新、初心者のための実践的なガイドを提供することである。
論文 参考訳(メタデータ) (2024-06-27T16:30:50Z) - Interpretability is in the Mind of the Beholder: A Causal Framework for
Human-interpretable Representation Learning [22.201878275784246]
説明可能なAIは、入力機能などの低レベル要素の観点から定義された説明から、データから学んだ解釈可能な概念でエンコードされた説明へとシフトしている。
しかし、そのような概念を確実に取得する方法は、基本的には不明確である。
ポストホックな説明器と概念に基づくニューラルネットワークの両方に適した解釈可能な表現を得るための数学的枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-14T14:26:20Z) - Towards CausalGPT: A Multi-Agent Approach for Faithful Knowledge Reasoning via Promoting Causal Consistency in LLMs [60.244412212130264]
Causal-Consistency Chain-of-Thoughtは、基礎モデルの忠実さと因果性を強化するために、マルチエージェントコラボレーションを活用する。
我々のフレームワークは、広範囲かつ包括的な評価を通じて、最先端の手法よりも大きな優位性を示す。
論文 参考訳(メタデータ) (2023-08-23T04:59:21Z) - Causal Explanations and XAI [8.909115457491522]
説明可能な人工知能(XAI)の重要な目標は、説明を提供することでミスマッチを補うことである。
十分な説明と事実的説明の因果的概念を正式に定義し、さらに一歩踏み出します。
また、この研究のAIにおける公正性に対する重要性についても触れ、パス固有の反現実的公正性の概念を改善するために、実際の因果関係をどのように利用できるかを示しています。
論文 参考訳(メタデータ) (2022-01-31T12:32:10Z) - Human Interpretation of Saliency-based Explanation Over Text [65.29015910991261]
テキストデータ上でのサリエンシに基づく説明について検討する。
人はしばしば説明を誤って解釈する。
本稿では,過度知覚と過小認識のモデル推定に基づいて,サリエンシを調整する手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T15:20:32Z) - Did they answer? Subjective acts and intents in conversational discourse [48.63528550837949]
英会話の複数の主観的かつ主観的な解釈を含む最初の対話データセットを提示する。
意見の相違が曖昧であることを示し、異なる文脈要因についてより深く理解する必要がある。
論文 参考訳(メタデータ) (2021-04-09T16:34:19Z) - Fairness and Robustness of Contrasting Explanations [9.104557591459283]
対比する説明の個人の公平性と堅牢性を研究します。
反実説明の個人的公平性を改善するために,最も近い反実語の代わりに実用可能な反実語を使用することを提案する。
論文 参考訳(メタデータ) (2021-03-03T12:16:06Z) - The Counterfactual NESS Definition of Causation [3.198144010381572]
我々の定義は実際には、ライトの有名なNESSの因果関係の定義と反実差分法条件の形式化であることを示している。
プリエンプションのケースの問題点分析を回避するために、差別化条件を弱めるように、定義を変更しました。
論文 参考訳(メタデータ) (2020-12-09T15:57:56Z) - Thinking About Causation: A Causal Language with Epistemic Operators [58.720142291102135]
我々はエージェントの状態を表すことで因果モデルの概念を拡張した。
対象言語の側面には、知識を表現する演算子や、新しい情報を観察する行為が追加されます。
我々は、論理の健全かつ完全な公理化を提供し、このフレームワークと因果的チーム意味論との関係について論じる。
論文 参考訳(メタデータ) (2020-10-30T12:16:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。