論文の概要: AI, Take the Wheel: What Drives Delegation and Trust in Human-Computer Cooperative Question Answering?
- arxiv url: http://arxiv.org/abs/2605.28255v1
- Date: Wed, 27 May 2026 10:05:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.956756
- Title: AI, Take the Wheel: What Drives Delegation and Trust in Human-Computer Cooperative Question Answering?
- Title(参考訳): AI, Take the Wheel: 人間とコンピュータの協力による質問応答におけるデリゲーションと信頼を駆動するものは何か?
- Authors: Maharshi Gor, Yoo Yeon Sung, Yu Hou, Eve Fleisig, Irene Ying, Tianyi Zhou, Jordan Boyd-Graber,
- Abstract要約: 人間は自分の判断よりもAIを信頼するかを決める際に間違いを犯すことがある。
我々は、デリゲート選択と採用選択の2つの異なる依存度決定について研究する。
人間は、正しいAI提案を過度に検討し、AIがそれらを誤解した場合に過度に回答するという、最適なコラボレーション決定をする。
- 参考スコア(独自算出の注目度): 22.50855320823746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI systems are fallible, and humans can make mistakes in deciding whether to trust AI over their own judgment. Thus, improving human-AI collaboration requires understanding when, why, and how humans decide to rely on AI. We study two distinct reliance decisions: the delegation choice -- deciding when to let AI act autonomously without knowing its output, and the adoption choice -- evaluating AI suggestions and deciding how to use them. Both of these decoupled reliance patterns shape collaboration, but prior work rarely studies them together in realistic settings with the same users. We address this gap by studying collaborative human--AI teams competing in a question-answering game in which humans can choose when and how to work with AI agents to win. Our 24 matches pair 23 expert humans with 16 AI agents, capturing 387 delegation and 1440 adoption decisions. While human--AI collaboration performs better than either AI or humans alone, humans make suboptimal collaboration decisions, both under-relying on correct AI suggestions (3.9% of opportunities missed) and over-relying when AI misleads them (1.7%). Both parties contribute wrong answers: reported model confidence is near chance when humans and AI disagree, while confirmation bias drives higher under-reliance (64.5%) when an AI suggestion agrees with humans' initial incorrect answer. To close this gap, we recommend calibrated confidence, evidence-grounded explanations, and mechanisms that help users refine trust.
- Abstract(参考訳): AIシステムは失敗し、人間はAIを自分自身の判断よりも信頼するかどうかを決めるのに間違いを犯す。
したがって、人間とAIのコラボレーションを改善するには、いつ、なぜ、どのように人間がAIに頼るかを理解する必要がある。
デリゲートの選択 -- アウトプットを知らずにAIを自律的に動作させる決定 -- と、採用選択 -- は、AI提案の評価と、それの使用方法の決定です。
これらの分離された依存パターンはどちらもコラボレーションを形成するが、以前の作業では、同じユーザと現実的な設定でそれらを一緒に研究することはめったにない。
我々は、AIエージェントといつ、どのように仕事をするかを人間が選択できる質問回答ゲームで競合する協力的な人間-AIチームを研究することで、このギャップに対処する。
私たちの24のマッチは、23人の専門家と16人のAIエージェントをペアにし、387人の代表団と1440人の採用決定をキャプチャします。
人間とAIのコラボレーションは、AIまたは人間単独よりも優れているが、人間は、正しいAI提案を過小評価し(3.9%の機会を逃した)、AIがそれらを誤解したとき(1.7%)、過度に回答する。
モデル信頼性の報告は、人間とAIが意見が一致しない場合、そしてAI提案が人間の最初の誤った回答に一致する場合、確認バイアスがより信頼度が高い(64.5%)。
このギャップを埋めるために、私たちは、信頼性の調整、エビデンスに基づく説明、そしてユーザーが信頼を磨くのに役立つメカニズムを推奨します。
関連論文リスト
- Toward Human-AI Complementarity Across Diverse Tasks [3.6671496239276475]
人間とAIの相補性は、人間とAIの判断を組み合わせることが、単独でより優れているという考え方である。
本研究では,現実的なタスクにおいて人間とAIの相補性が達成できるかどうかを考察する。
微妙な相補性の増加しか見つからない。
論文 参考訳(メタデータ) (2026-04-13T07:24:18Z) - How Performance Pressure Influences AI-Assisted Decision Making [52.997197698288936]
我々は、プレッシャーと説明可能なAI(XAI)技術がAIアドバイステイク行動とどのように相互作用するかを示す。
我々の結果は、圧力とXAIの異なる組み合わせで複雑な相互作用効果を示し、AIアドバイスの行動を改善するか、悪化させるかのどちらかを示す。
論文 参考訳(メタデータ) (2024-10-21T22:39:52Z) - Improving Human-AI Collaboration With Descriptions of AI Behavior [14.904401331154062]
人々はAIシステムを使って意思決定を改善するが、しばしばAIの予測を過度に、あるいは過度に予測し、手伝わなかったよりも悪いパフォーマンスをする。
人々がAIアシスタントを適切に頼りにするために、行動記述を示すことを提案する。
論文 参考訳(メタデータ) (2023-01-06T00:33:08Z) - Measuring an artificial intelligence agent's trust in humans using
machine incentives [2.1016374925364616]
人間に対するAIエージェントの信頼を評価することは難しい。
本稿では,AIエージェントのアルゴリズムやゴールオリエンテーションを変更することなく,機械決定をインセンティブ化する手法を提案する。
我々の実験は、これまでで最も先進的なAI言語モデルの一つがインセンティブに反応して社会行動を変えることを示唆している。
論文 参考訳(メタデータ) (2022-12-27T06:05:49Z) - Uncalibrated Models Can Improve Human-AI Collaboration [10.106324182884068]
私たちは、AIモデルを実際によりも自信を持って提示することで、人間-AIのパフォーマンスが向上することを示した。
私たちはまず、何千もの人間のインタラクションのデータを使って、人間がAIアドバイスを組み込む方法のモデルを学びます。
論文 参考訳(メタデータ) (2022-02-12T04:51:00Z) - Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。
これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文 参考訳(メタデータ) (2022-01-26T18:53:09Z) - Trustworthy AI: A Computational Perspective [54.80482955088197]
我々は,信頼に値するAIを実現する上で最も重要な6つの要素,(i)安全とロバスト性,(ii)非差別と公正,(iii)説明可能性,(iv)プライバシー,(v)説明可能性と監査性,(vi)環境ウェルビーイングに焦点をあてる。
各次元について、分類学に基づく最近の関連技術について概観し、実世界のシステムにおけるそれらの応用を概説する。
論文 参考訳(メタデータ) (2021-07-12T14:21:46Z) - Does the Whole Exceed its Parts? The Effect of AI Explanations on
Complementary Team Performance [44.730580857733]
以前の研究では、AIが人間と最高のチームの両方を上回った場合にのみ、説明による改善が観察された。
我々は、3つのデータセットで混合メソッドのユーザー研究を行い、人間に匹敵する精度のAIが、参加者のタスク解決に役立ちます。
説明は、人間がAIの推奨を受け入れる可能性を高める。
論文 参考訳(メタデータ) (2020-06-26T03:34:04Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z) - Effect of Confidence and Explanation on Accuracy and Trust Calibration
in AI-Assisted Decision Making [53.62514158534574]
ケース固有のモデル情報を明らかにする特徴が、信頼度を調整し、人間とAIのジョイントパフォーマンスを向上させることができるかどうかを検討する。
信頼スコアは、AIモデルに対する人々の信頼を校正するのに役立ちますが、信頼の校正だけでは、AI支援による意思決定を改善するには不十分です。
論文 参考訳(メタデータ) (2020-01-07T15:33:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。