論文の概要: Directly Optimizing Explanations for Desired Properties
- arxiv url: http://arxiv.org/abs/2410.23880v1
- Date: Thu, 31 Oct 2024 12:40:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 17:01:02.629789
- Title: Directly Optimizing Explanations for Desired Properties
- Title(参考訳): 劣化特性の直接的最適化
- Authors: Hiwot Belay Tadesse, Alihan Hüyük, Weiwei Pan, Finale Doshi-Velez,
- Abstract要約: 所望の特性に対する説明を直接最適化することを提案する。
我々の直接的なアプローチは、最適なプロパティを持つ説明をより一貫して生成するだけでなく、ユーザが異なるプロパティ間のトレードオフを制御できるようにする。
- 参考スコア(独自算出の注目度): 29.275374213059646
- License:
- Abstract: When explaining black-box machine learning models, it's often important for explanations to have certain desirable properties. Most existing methods `encourage' desirable properties in their construction of explanations. In this work, we demonstrate that these forms of encouragement do not consistently create explanations with the properties that are supposedly being targeted. Moreover, they do not allow for any control over which properties are prioritized when different properties are at odds with each other. We propose to directly optimize explanations for desired properties. Our direct approach not only produces explanations with optimal properties more consistently but also empowers users to control trade-offs between different properties, allowing them to create explanations with exactly what is needed for a particular task.
- Abstract(参考訳): ブラックボックス機械学習モデルを説明する際には、特定の望ましい特性を持つことがしばしば重要である。
既存のほとんどのメソッドは、説明の構築において望ましい特性を'encourage'する。
本研究は,これらの奨励形態が,対象とされると思われる性質を常に説明できないことを示すものである。
さらに、異なるプロパティが互いに相反する場合に、プロパティが優先順位付けされるような制御を許可しない。
所望の特性に対する説明を直接最適化することを提案する。
我々の直接的なアプローチは、最適なプロパティを持つ説明をより一貫して生成するだけでなく、ユーザが異なるプロパティ間のトレードオフを制御できるようにし、特定のタスクに何が必要なのかを正確に記述できるようにします。
関連論文リスト
- Axiomatic Characterisations of Sample-based Explainers [8.397730500554047]
サンプルやデータセットから特徴に基づく説明を生成する説明を精査する。
我々は、他のすべてと互換性のある2つの重要な特性を満たす説明者のファミリー全体を識別する。
我々は、説明の存在と不確実なグローバル整合性を保証する最初の(広義の)説明者を紹介する。
論文 参考訳(メタデータ) (2024-08-09T07:10:07Z) - Complementary Explanations for Effective In-Context Learning [77.83124315634386]
大規模言語モデル (LLM) は、説明のインプロンプトから学習する際、顕著な能力を示した。
この研究は、文脈内学習に説明が使用されるメカニズムをよりよく理解することを目的としている。
論文 参考訳(メタデータ) (2022-11-25T04:40:47Z) - What Makes a Good Explanation?: A Harmonized View of Properties of Explanations [22.752085594102777]
解釈可能性(Interpretability)は、機械学習(ML)モデルの側面を検証する手段を提供する。
異なる文脈は異なる性質を持つ説明を必要とする。
説明の性質に関しては標準化の欠如がある。
論文 参考訳(メタデータ) (2022-11-10T16:04:28Z) - Diagnostics-Guided Explanation Generation [32.97930902104502]
説明は機械学習モデルの合理性に光を当て、推論プロセスにおける欠陥の特定に役立ちます。
文レベルの説明を生成するためにモデルを訓練する際、いくつかの診断特性を最適化する方法を示す。
論文 参考訳(メタデータ) (2021-09-08T16:27:52Z) - Are Training Resources Insufficient? Predict First Then Explain! [54.184609286094044]
我々は、予測理論(PtE)アーキテクチャはモデリングの観点からより効率的なアプローチであると主張している。
PtE構造は説明データが欠如している場合に最もデータ効率のよい手法であることを示す。
論文 参考訳(メタデータ) (2021-08-29T07:04:50Z) - Prompting Contrastive Explanations for Commonsense Reasoning Tasks [74.7346558082693]
大規模事前学習言語モデル(PLM)は、常識推論タスクにおいて、ほぼ人間に近い性能を達成することができる。
人間の解釈可能な証拠を生成するために、同じモデルを使う方法を示す。
論文 参考訳(メタデータ) (2021-06-12T17:06:13Z) - Towards Rigorous Interpretations: a Formalisation of Feature Attribution [6.905391624417595]
リラックスした機能依存の概念に基づいた機能選択/属性の形式化を提案する。
合成データセットのアーストルースアトリビューションを計算することで、最適化された場合でも、提案された特性を検証し、間違ったソリューションを提供することに失敗する人もいます。
論文 参考訳(メタデータ) (2021-04-26T10:04:44Z) - Contrastive Explanations for Reinforcement Learning via Embedded Self
Predictions [24.460079819591677]
本研究では,学習者が他者よりも行動を好む理由を説明するための,深層強化学習アーキテクチャについて検討する。
鍵となる考え方は、期待される未来の人間の理解可能な特性を通して直接表現されるアクション値を学ぶことである。
複雑な戦略ゲームを含む3つの領域におけるケーススタディは、ESPモデルを効果的に学習し、洞察に富んだ説明を支援することができることを示している。
論文 参考訳(メタデータ) (2020-10-11T07:02:20Z) - The Struggles of Feature-Based Explanations: Shapley Values vs. Minimal
Sufficient Subsets [61.66584140190247]
機能に基づく説明は、自明なモデルでも問題を引き起こすことを示す。
そこで本研究では,2つの一般的な説明書クラスであるシェープリー説明書と十分最小限の部分集合説明書が,基本的に異なる基底的説明書のタイプをターゲットにしていることを示す。
論文 参考訳(メタデータ) (2020-09-23T09:45:23Z) - Evaluations and Methods for Explanation through Robustness Analysis [117.7235152610957]
分析による特徴に基づく説明の新たな評価基準を確立する。
我々は、緩やかに必要であり、予測に十分である新しい説明を得る。
我々は、現在の予測をターゲットクラスに移動させる一連の特徴を抽出するために、説明を拡張します。
論文 参考訳(メタデータ) (2020-05-31T05:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。