論文の概要: Learning to Decide with AI Assistance under Human-Alignment
- arxiv url: http://arxiv.org/abs/2605.12646v1
- Date: Tue, 12 May 2026 18:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.620224
- Title: Learning to Decide with AI Assistance under Human-Alignment
- Title(参考訳): ヒューマンアライメントによるAI支援による意思決定の学習
- Authors: Nina Corvelo Benz, Eleni Straitouri, Manuel Gomez-Rodriguez,
- Abstract要約: 我々は,AIと人間の信頼を完璧に一致させることで,学習者が期待される$O(sqrt|H| cdot Tlog Tlog Tlog T)の後悔を達成できることを示した。
まとめると、これらの結果は、アライメントがAIアシストで意思決定を行うための学習の複雑さを減少させることを示している。
- 参考スコア(独自算出の注目度): 15.478223490614686
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is widely agreed that when AI models assist decision-makers in high-stakes domains by predicting an outcome of interest, they should communicate the confidence of their predictions. However, empirical evidence suggests that decision-makers often struggle to determine when to trust a prediction based solely on this communicated confidence. In this context, recent theoretical and empirical work suggests a positive correlation between the utility of AI-assisted decision-making and the degree of alignment between the AI confidence and the decision-makers' confidence in their own predictions. Crucially, these findings do not yet elucidate the extent to which this alignment influences the complexity of learning to make optimal decisions through repeated interactions. In this paper, we address this question in the canonical case of binary predictions and binary decisions. We first show that this problem is equivalent to a two-armed online contextual learning problem with full feedback, and establish a lower bound of $Ω(\sqrt{|H| \cdot |B| \cdot T} )$ on the expected regret any learner can attain, where $H$ and $B$ denote the sets of human and AI confidence values. We then demonstrate that, under perfect alignment between AI and human confidence, a learner can attain an expected regret of $O(\sqrt{|H| \cdot T\log T})$ and, when $\sqrt{|H|} = O(\log T)$ and $B$ is countable, a non-trivial generalization of the Dvoretzky-Kiefer-Wolfowitz inequality improves the regret bound to $O(\sqrt{T\log T})$. Taken together, these results reveal that alignment can reduce the complexity of learning to make decisions with AI assistance. Experiments on real data from two different human-subject studies where participants solve simple decision-making tasks assisted by AI models show that our theoretical results are robust to violations of perfect alignment.
- Abstract(参考訳): AIモデルは、関心の結果を予測することによって、ハイテイクドメインの意思決定者を支援することで、予測の信頼性を伝えることが広く合意されている。
しかし、実証的な証拠は、意思決定者が、このコミュニケーションされた信頼のみに基づいて予測をいつ信頼するかを判断するのに苦労していることを示唆している。
この文脈において、最近の理論的および実証的な研究は、AI支援意思決定の有用性と、AIの信頼性と意思決定者自身の予測に対する信頼度との間に正の相関関係があることを示唆している。
重要なことに、これらの発見は、このアライメントが学習の複雑さに影響を与え、反復的な相互作用を通じて最適な決定を下す程度を、まだ解明していない。
本稿では,二項予測と二項決定の正準の場合において,この問題に対処する。
まず、この問題は、完全なフィードバックを伴う2本腕のオンライン文脈学習問題と等価であることを示し、予想される後悔に対して、$Ω(\sqrt{|H| \cdot |B| \cdot T} )$を低く設定し、そこでは、$H$と$B$は、人間とAIの信頼度値の集合を表す。
すると、AIと人間の信頼の完全な一致の下で、学習者は$O(\sqrt{|H| \cdot T\log T})$と、$\sqrt{|H|} = O(\log T)$と$B$が可算であるときに、Dvoretzky-Kiefer-Wolfowitzの不等式の非自明な一般化により、$O(\sqrt{T\log T})$への後悔が改善されることを示す。
まとめると、これらの結果は、アライメントがAIアシストで意思決定を行うための学習の複雑さを減少させることを示している。
AIモデルによって支援された単純な意思決定タスクを参加者が解決する2つの異なる対象研究による実データ実験は、我々の理論的結果が完全な整合性違反に対して堅牢であることを示している。
関連論文リスト
- Trustworthy AI Suffers from Invariance Conflicts and Causality is The Solution [80.98492754957466]
公正性、堅牢性、プライバシ、説明可能性といった、信頼性の高いAI目標を同時に達成することは難しい。
本稿では、パフォーマンスにおけるトレードオフを理解しバランスをとるためには因果性が必要であると論じ、信頼できるAIの複数の目的について論じる。
論文 参考訳(メタデータ) (2026-05-04T14:26:28Z) - Conformal Prediction and Trustworthy AI [1.6574413179773761]
コンフォーマル予測器は1990年代にガマーマン、ヴォフク、研究チームによって開発され、信頼度が保証されたセット予測を提供するために開発された。
近年、彼らは人気を博し、機械学習コミュニティにおける不確実性定量化の主流の方法論となっている。
本稿では、その限界有効性を超えて、信頼に値するAIに寄与するコンフォーマル予測の可能性についてレビューする。
論文 参考訳(メタデータ) (2025-08-09T08:28:59Z) - Cascaded Language Models for Cost-effective Human-AI Decision-Making [52.81324217423194]
複数の専門分野にまたがってタスクを適応的に委譲するLLM決定フレームワークを提案する。
まず、deferral Policyは、ベースモデルの回答を受け入れるか、あるいは大きなモデルでそれを再生するかを決定する。
第2に、禁忌ポリシーは、カスケードモデル応答が十分に確実であるか、または人間の介入を必要とするかを判定する。
論文 参考訳(メタデータ) (2025-06-13T15:36:22Z) - Human-Alignment Influences the Utility of AI-assisted Decision Making [16.732483972136418]
我々は,アライメントの程度が,AIによる意思決定の有用性に与える影響について検討する。
以上の結果から,AIによる意思決定におけるアライメントの程度と有効性との関連が示唆された。
論文 参考訳(メタデータ) (2025-01-23T19:01:47Z) - On the meaning of uncertainty for ethical AI: philosophy and practice [10.591284030838146]
これは、数学的推論に倫理的考察をもたらす重要な方法であると主張する。
我々は、2021年12月のOmicron型COVID-19の拡散について、英国政府に助言するために使用される競合モデルの文脈内でこれらのアイデアを実証する。
論文 参考訳(メタデータ) (2023-09-11T15:13:36Z) - AI Reliance and Decision Quality: Fundamentals, Interdependence, and the Effects of Interventions [6.356355538824237]
私たちは、AIによる意思決定に関する現在の文献で、信頼と意思決定品質が不適切に混ざり合っていると論じています。
我々の研究は、AIによる意思決定における信頼行動と意思決定品質の区別の重要性を強調している。
論文 参考訳(メタデータ) (2023-04-18T08:08:05Z) - Fairness in AI and Its Long-Term Implications on Society [68.8204255655161]
AIフェアネスを詳しく見て、AIフェアネスの欠如が、時間の経過とともにバイアスの深化につながるかを分析します。
偏りのあるモデルが特定のグループに対してよりネガティブな現実的な結果をもたらすかについて議論する。
問題が続くと、他のリスクとの相互作用によって強化され、社会不安という形で社会に深刻な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2023-04-16T11:22:59Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z) - Effect of Confidence and Explanation on Accuracy and Trust Calibration
in AI-Assisted Decision Making [53.62514158534574]
ケース固有のモデル情報を明らかにする特徴が、信頼度を調整し、人間とAIのジョイントパフォーマンスを向上させることができるかどうかを検討する。
信頼スコアは、AIモデルに対する人々の信頼を校正するのに役立ちますが、信頼の校正だけでは、AI支援による意思決定を改善するには不十分です。
論文 参考訳(メタデータ) (2020-01-07T15:33:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。