論文の概要: Improving understanding and trust in AI: How users benefit from interval-based counterfactual explanations
- arxiv url: http://arxiv.org/abs/2604.09573v1
- Date: Sun, 22 Feb 2026 19:40:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.811869
- Title: Improving understanding and trust in AI: How users benefit from interval-based counterfactual explanations
- Title(参考訳): AIの理解と信頼を改善する - インターバルベースの対実的説明の恩恵について
- Authors: Tabea E. Röber, Paul Festor, Rob Goedhart, S. İlker Birbil, Aldo Faisal,
- Abstract要約: 本研究の目的は, モデル理解と(実証的)信頼の両方に異なる種類の反事実的説明がどのような影響を及ぼすかを調査し, 評価することであった。
本研究は,AIにおけるモデル理解と信頼の両面において,他の試験的説明法よりも区間説明法の方が優れていることを示すものである。
- 参考スコア(独自算出の注目度): 1.2893576217358407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Experimental user studies evaluating the effectiveness of different subtypes of post-hoc explanations for black-box models are largely nonexistent. Therefore, the aim of this study was to investigate and evaluate how different types of counterfactual explanations, namely single point explanations and interval-based explanations, affect both model understanding and (demonstrated) trust. We conducted an online user study using a within-subjects experimental design, where the experimental arms were (i) no explanation (control), (ii) feature importance scores, (iii) point counterfactual explanations, and (iv) interval counterfactual explanations. Our results clearly show the superiority of interval explanations over other tested explanation types in increasing both model understanding and demonstrated trust in the AI. We could not support findings of some previous studies showing an effect of point counterfactual explanations compared to the control group. Our results further highlight the role individual differences in, for example, cognitive style or personality, in explanation effectiveness.
- Abstract(参考訳): ブラックボックスモデルに対するポストホック説明の異なるサブタイプの有効性を評価する実験ユーザスタディはほとんど存在しない。
そこで本研究では,モデル理解と(実証的)信頼の両面において,単一点説明と区間的説明の相違がどう影響するかを検討・評価することを目的とした。
実験用アームを内装した実験機を用いたオンラインユーザスタディを行った。
(i)説明なし(制御)
(ii)重要度スコア
三 反事実的説明、及び
(四)反実的説明の間隔
本研究は,AIにおけるモデル理解と信頼の両面において,他の試験的説明法よりも区間説明法の方が優れていることを示すものである。
本研究は, 制御群と比較して, 点対実的説明の効果を示す先行研究の成果を裏付けることができない。
以上の結果から,認知スタイルや個性などにおける個人差が,有効性を説明する上で果たす役割を強調した。
関連論文リスト
- Self-Rationalization in the Wild: A Large Scale Out-of-Distribution Evaluation on NLI-related tasks [59.47851630504264]
自由文の説明は表現力があり理解しやすいが、多くのデータセットには注釈付き説明データがない。
我々は、T5-LargeモデルとOLMo-7Bモデルを微調整し、微調整データ品質、微調整サンプル数、少数ショット選択方法の影響を評価した。
モデルは、自然言語推論(NLI)、ファクトチェック、抽象的な要約における幻覚検出の3つのタスクにまたがる19の多様なOODデータセットで評価される。
論文 参考訳(メタデータ) (2025-02-07T10:01:32Z) - Exploring the Plausibility of Hate and Counter Speech Detectors with Explainable AI [0.7317046947172644]
グラデーションベース,摂動ベース,注意ベース,プロトタイプベースという4つの異なる説明可能性アプローチを比較した。
その結果,摂動に基づく説明可能性が最も優れており,次に勾配に基づく説明可能性,注意に基づく説明可能性を示す。
論文 参考訳(メタデータ) (2024-07-25T10:17:04Z) - Towards Understanding the Influence of Training Samples on Explanations [5.695152528716705]
説明可能なAI(XAI)は、AIシステムの意思決定を分析するために広く使われている。
予期せぬ説明が発生した場合、ユーザーはそれらを形作るトレーニングデータプロパティを理解したいかもしれない。
データ評価の領域では、データサンプルが与えられたモデルに与える影響を推定する最初のアプローチが提案されている。
論文 参考訳(メタデータ) (2024-06-05T07:20:06Z) - Explainability for Machine Learning Models: From Data Adaptability to
User Perception [0.8702432681310401]
この論文は、すでにデプロイされた機械学習モデルに対する局所的な説明の生成を探求する。
データとユーザ要件の両方を考慮して、意味のある説明を生み出すための最適な条件を特定することを目的としている。
論文 参考訳(メタデータ) (2024-02-16T18:44:37Z) - Evaluating the Utility of Model Explanations for Model Development [54.23538543168767]
機械学習モデル構築の実践シナリオにおいて、説明が人間の意思決定を改善するかどうかを評価する。
驚いたことに、サリエンシマップが提供されたとき、タスクが大幅に改善されたという証拠は見つからなかった。
以上の結果から,サリエンシに基づく説明における誤解の可能性と有用性について注意が必要であることが示唆された。
論文 参考訳(メタデータ) (2023-12-10T23:13:23Z) - On the Connection between Game-Theoretic Feature Attributions and
Counterfactual Explanations [14.552505966070358]
最も一般的な説明は、特徴属性と反実的説明である。
この研究は、ゲーム理論的特徴属性と反事実的説明の間に明確な理論的関係を確立する。
我々は、特徴的重要性を提供するために、反事実的説明を用いることの限界に光を当てた。
論文 参考訳(メタデータ) (2023-07-13T17:57:21Z) - Counterfactuals of Counterfactuals: a back-translation-inspired approach
to analyse counterfactual editors [3.4253416336476246]
我々は、反事実的、対照的な説明の分析に焦点をあてる。
本稿では,新しい逆翻訳に基づく評価手法を提案する。
本研究では, 予測モデルと説明モデルの両方の振る舞いについて, 反事実を反復的に説明者に与えることで, 価値ある洞察を得ることができることを示す。
論文 参考訳(メタデータ) (2023-05-26T16:04:28Z) - Complementary Explanations for Effective In-Context Learning [77.83124315634386]
大規模言語モデル (LLM) は、説明のインプロンプトから学習する際、顕著な能力を示した。
この研究は、文脈内学習に説明が使用されるメカニズムをよりよく理解することを目的としている。
論文 参考訳(メタデータ) (2022-11-25T04:40:47Z) - Human Interpretation of Saliency-based Explanation Over Text [65.29015910991261]
テキストデータ上でのサリエンシに基づく説明について検討する。
人はしばしば説明を誤って解釈する。
本稿では,過度知覚と過小認識のモデル推定に基づいて,サリエンシを調整する手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T15:20:32Z) - Contrastive Explanations for Model Interpretability [77.92370750072831]
分類モデルの対照的説明を生成する手法を提案する。
本手法は潜在空間へのモデル表現の投影に基づいている。
本研究は,モデル決定のより正確できめ細かな解釈性を提供するためのラベルコントラスト的説明の能力に光を当てた。
論文 参考訳(メタデータ) (2021-03-02T00:36:45Z) - Evaluating Explanations: How much do explanations from the teacher aid
students? [103.05037537415811]
本研究では,説明が生徒の学習モデルを改善する程度を測る学生-教師パラダイムを用いて,説明の価値を定式化する。
説明を評価するための従来の提案とは異なり、我々のアプローチは容易にゲーム化できず、原則付き、スケーラブルで、属性の自動評価を可能にします。
論文 参考訳(メタデータ) (2020-12-01T23:40:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。