論文の概要: The Persuasion Paradox: When LLM Explanations Fail to Improve Human-AI Team Performance
- arxiv url: http://arxiv.org/abs/2604.03237v1
- Date: Sat, 31 Jan 2026 20:23:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.343785
- Title: The Persuasion Paradox: When LLM Explanations Fail to Improve Human-AI Team Performance
- Title(参考訳): 説得パラドックス: LLM説明が人間-AIチームのパフォーマンス改善に失敗したとき
- Authors: Ruth Cohen, Lu Feng, Ayala Bloch, Sarit Kraus,
- Abstract要約: 流動的な説明は、確実に改善することなく、AIへのユーザの信頼と信頼を体系的に向上させ、場合によってはタスク精度を損なう。
以上の結果から,信頼,信頼,明快さなどの主観的指標が,人間-AIチームパフォーマンスの予測に乏しいことが示唆された。
- 参考スコア(独自算出の注目度): 16.560095082937874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While natural-language explanations from large language models (LLMs) are widely adopted to improve transparency and trust, their impact on objective human-AI team performance remains poorly understood. We identify a Persuasion Paradox: fluent explanations systematically increase user confidence and reliance on AI without reliably improving, and in some cases undermining, task accuracy. Across three controlled human-subject studies spanning abstract visual reasoning (RAVEN matrices) and deductive logical reasoning (LSAT problems), we disentangle the effects of AI predictions and explanations using a multi-stage reveal design and between-subjects comparisons. In visual reasoning, LLM explanations increase confidence but do not improve accuracy beyond the AI prediction alone, and substantially suppress users' ability to recover from model errors. Interfaces exposing model uncertainty via predicted probabilities, as well as a selective automation policy that defers uncertain cases to humans, achieve significantly higher accuracy and error recovery than explanation-based interfaces. In contrast, for language-based logical reasoning tasks, LLM explanations yield the highest accuracy and recovery rates, outperforming both expert-written explanations and probability-based support. This divergence reveals that the effectiveness of narrative explanations is strongly task-dependent and mediated by cognitive modality. Our findings demonstrate that commonly used subjective metrics such as trust, confidence, and perceived clarity are poor predictors of human-AI team performance. Rather than treating explanations as a universal solution, we argue for a shift toward interaction designs that prioritize calibrated reliance and effective error recovery over persuasive fluency.
- Abstract(参考訳): 大規模言語モデル(LLM)からの自然言語の説明は透明性と信頼を高めるために広く採用されているが、客観的な人間-AIチームのパフォーマンスへの影響は理解されていない。
流動的な説明は、確実に改善することなく、AIへのユーザの信頼と信頼を体系的に向上させ、場合によってはタスク精度を損なう。
抽象的視覚的推論(RAVEN行列)と帰納的論理的推論(LSAT問題)にまたがる3つの制御対象研究において、多段階露光設計と対象間比較を用いてAI予測と説明の影響を解き放つ。
視覚的推論では、LCMの説明は信頼性を高めるが、AI予測以外の精度は向上せず、モデルのエラーから回復する能力を大幅に抑制する。
予測確率によるモデル不確実性を露呈するインタフェースと、人間に不確実なケースを無視する選択的な自動化ポリシーは、説明に基づくインタフェースよりもはるかに高い精度とエラー回復を達成する。
対照的に、言語に基づく論理的推論タスクでは、LSMの説明は、専門家による説明と確率に基づくサポートの両方よりも高い精度と回復率が得られる。
この分岐は、物語説明の有効性が強いタスク依存であり、認知的モダリティが介在していることを明らかにする。
以上の結果から,信頼,信頼,明快さなどの主観的指標が,人間-AIチームパフォーマンスの予測に乏しいことが示唆された。
我々は、説明を普遍的な解として扱うのではなく、キャリブレーションされた信頼度を優先し、説得的流速よりも効果的なエラー回復を優先する相互作用設計へのシフトを論じる。
関連論文リスト
- When AI Persuades: Adversarial Explanation Attacks on Human Trust in AI-Assisted Decision Making [7.170587130743388]
大規模言語モデルは、ユーザーがAI出力をどのように認識し、信頼するかを形作る、流動的な自然言語の説明を生成する。
本研究では,攻撃者がLDM生成説明書のフレーミングを操作し,不正確な出力に対する人間の信頼を調節する逆説明攻撃(AEAs)を導入する。
これは、説明を敵対的な認知チャネルとして扱い、AIによる意思決定に対する人間の信頼への影響を定量化する最初の体系的なセキュリティ研究である。
論文 参考訳(メタデータ) (2026-02-03T20:42:44Z) - The AI Cognitive Trojan Horse: How Large Language Models May Bypass Human Epistemic Vigilance [0.0]
大規模言語モデル(LLM)に基づく会話型AIシステムは、人間の認識に挑戦する。
本稿では,会話型AIによる有意なてんかんリスクは,不正確さや意図的な騙しではなく,より根本的なものであることを示唆する。
論文 参考訳(メタデータ) (2026-01-11T22:28:56Z) - Cognitive Inception: Agentic Reasoning against Visual Deceptions by Injecting Skepticism [81.39177645864757]
完全推論に基づくエージェント推論フレームワークであるtextbfInception を提案する。
私たちの知る限りでは、AIGCの視覚的騙しに対する完全な推論ベースのフレームワークとしてはこれが初めてです。
論文 参考訳(メタデータ) (2025-11-21T05:13:30Z) - Exploring and Exploiting the Inherent Efficiency within Large Reasoning Models for Self-Guided Efficiency Enhancement [101.77467538102924]
大きな推論モデル(LRM)は、効率を阻害し、推論コストを膨らませる過剰な考えを示す。
LRM効率を向上させるための2つの軽量手法を提案する。
まず,学習不要なアクティベーションステアリング技術であるEfficic Steeringを導入する。
第2に,タスクの正確さと簡潔さを動的にバランスする強化学習フレームワークである自己回帰効率RLを開発する。
論文 参考訳(メタデータ) (2025-06-18T17:18:12Z) - Learning to Generate and Evaluate Fact-checking Explanations with Transformers [10.970249299147866]
XAI(Explainable Artificial Antelligence)の研究
我々は,人間のアクセス可能な説明を生成することによって,意思決定を文脈化し,正当化するトランスフォーマーベースの事実チェックモデルを開発した。
我々は人工知能(AI)による説明と人間の判断を一致させる必要性を強調した。
論文 参考訳(メタデータ) (2024-10-21T06:22:51Z) - "I'm Not Sure, But...": Examining the Impact of Large Language Models' Uncertainty Expression on User Reliance and Trust [51.542856739181474]
不確実性の自然言語表現の違いが、参加者の信頼、信頼、全体的なタスクパフォーマンスにどのように影響するかを示す。
その結果, 一人称表情は, 参加者のシステムに対する信頼度を低下させ, 参加者の正確性を高めつつ, システムの回答に同調する傾向にあることがわかった。
以上の結果から,不確実性の自然言語表現の使用は,LLMの過度な依存を軽減するための効果的なアプローチである可能性が示唆された。
論文 参考訳(メタデータ) (2024-05-01T16:43:55Z) - Tuning-Free Accountable Intervention for LLM Deployment -- A
Metacognitive Approach [55.613461060997004]
大規模言語モデル(LLM)は、自然言語処理タスクの幅広い領域にわたる変換的進歩を触媒している。
我々は,自己認識型誤り識別と訂正機能を備えたLLMを実現するために,textbfCLEARと呼ばれる革新的なテキストメタ認知手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T19:18:53Z) - A Closer Look at the Self-Verification Abilities of Large Language Models in Logical Reasoning [73.77088902676306]
論理的推論の文脈において,大規模言語モデル(LLM)の自己検証能力について詳しく検討する。
本研究の主目的は,既存のLCMが誤った推論手順を正確に識別するのに苦労し,自己検証法の有効性を保証できないことにある。
論文 参考訳(メタデータ) (2023-11-14T07:13:10Z) - A Study on Multimodal and Interactive Explanations for Visual Question
Answering [3.086885687016963]
視覚質問応答(VQA)タスクの設定において,マルチモーダルな説明を評価する。
結果は,VQAシステムの解答が不正確である場合に,人間の予測精度の向上に役立つことを示唆している。
本稿では,注意マップの編集による介入による因果的注意効果評価手法であるアクティブアテンションを導入する。
論文 参考訳(メタデータ) (2020-03-01T07:54:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。