論文の概要: Selectively Providing Reliance Calibration Cues With Reliance Prediction
- arxiv url: http://arxiv.org/abs/2302.09995v1
- Date: Mon, 20 Feb 2023 14:15:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 15:15:00.157844
- Title: Selectively Providing Reliance Calibration Cues With Reliance Prediction
- Title(参考訳): 信頼度予測による信頼度校正手がかりの選択的提供
- Authors: Yosuke Fukuchi, Seiji Yamada
- Abstract要約: 信頼性校正キュー(RCC)を選択的に提供するPred-RCを提案する。
Pred-RCは認知信頼モデルを使用して、人間がエージェントにタスクを割り当てるかどうかを予測する。
我々は,人間とAIの協調作業においてPred-RCを試験し,RCCの削減による人的依存のキャリブレーションに成功した。
- 参考スコア(独自算出の注目度): 5.482532589225552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For effective collaboration between humans and intelligent agents that employ
machine learning for decision-making, humans must understand what agents can
and cannot do to avoid over/under-reliance. A solution to this problem is
adjusting human reliance through communication using reliance calibration cues
(RCCs) to help humans assess agents' capabilities. Previous studies typically
attempted to calibrate reliance by continuously presenting RCCs, and when an
agent should provide RCCs remains an open question. To answer this, we propose
Pred-RC, a method for selectively providing RCCs. Pred-RC uses a cognitive
reliance model to predict whether a human will assign a task to an agent. By
comparing the prediction results for both cases with and without an RCC,
Pred-RC evaluates the influence of the RCC on human reliance. We tested Pred-RC
in a human-AI collaboration task and found that it can successfully calibrate
human reliance with a reduced number of RCCs.
- Abstract(参考訳): 意思決定に機械学習を利用する人間とインテリジェントエージェントの効果的なコラボレーションには、過度な信頼を避けるために、人間は何が可能で何ができないのかを理解する必要がある。
この問題に対する解決策は、rcc(reliance calibration cues)を用いたコミュニケーションによる人間依存度調整であり、エージェントの能力を評価するのに役立つ。
従来の研究は通常、RCCを継続的に提示することで依存度を調整しようとしたが、いつエージェントがRCCを提供するべきかは未解決のままである。
そこで我々は,RCCを選択的に提供するためのPred-RCを提案する。
Pred-RCは認知信頼モデルを使用して、人間がエージェントにタスクを割り当てるかどうかを予測する。
両症例の予測結果とRCCの有無を比較することにより,Pred-RCはRCCが人的依存に与える影響を評価する。
我々は,人間とAIの協調作業においてPred-RCを試験し,RCCの削減による人的依存のキャリブレーションに成功した。
関連論文リスト
- Cross-Validation Conformal Risk Control [55.35424663904324]
コンフォーマルリスク制御(CRC)は、従来の点予測器にポストホックを適用してキャリブレーションを保証する手法である。
本稿では,従来のCRCの検証ではなく,クロスバリデーションに基づく新しいCRC手法を提案する。
CV-CRCは、設定された予測子の平均リスクに関する理論的保証を提供する。
論文 参考訳(メタデータ) (2024-01-22T14:26:02Z) - Benchmarking Multi-Agent Preference-based Reinforcement Learning for
Human-AI Teaming [16.701242561345786]
嗜好に基づく強化学習(PbRL)は研究の活発な領域であり、シングルエージェントアクターや観察者によるループのシナリオにおいて大きな進歩を遂げている。
両エージェントがチームに対する報酬関数に従って報酬を受ける2エージェント(Human-AI)の協調構成について検討する。
しかし、エージェントはそれにアクセスできず、その代わりに、人間ロボットチームにおけるロボットの目的と人間の好みを引き出すために、嗜好に基づくクエリを利用する。
論文 参考訳(メタデータ) (2023-12-21T20:48:15Z) - Neuroadaptation in Physical Human-Robot Collaboration [34.73541717674098]
我々は,pHRCのための新しいクローズドループニューラプティブフレームワークを実証した。
我々は,ロボット戦略に適応するために,強化学習の助けを借りて,認知コンフリクト情報をクローズループ方式で適用した。
実験の結果,クローズドループに基づくニューロアダプティブ・フレームワークは認知的対立のレベルを下げることができた。
論文 参考訳(メタデータ) (2023-09-30T12:16:24Z) - Incentive-Theoretic Bayesian Inference for Collaborative Science [59.15962177829337]
未知のパラメータについて、プライベートな先行エージェントが存在する場合の仮説テストについて検討する。
エージェントの戦略行動によって明らかにされる情報を活用する統計的推論を行う方法を示す。
論文 参考訳(メタデータ) (2023-07-07T17:59:01Z) - Provably Efficient Iterated CVaR Reinforcement Learning with Function
Approximation and Human Feedback [57.6775169085215]
リスクに敏感な強化学習は、期待される報酬とリスクのバランスをとるポリシーを最適化することを目的としている。
本稿では,線形および一般関数近似の下で,CVaR(Iterated Conditional Value-at-Risk)を目標とする新しいフレームワークを提案する。
本稿では,この反復CVaR RLに対するサンプル効率の高いアルゴリズムを提案し,厳密な理論的解析を行う。
論文 参考訳(メタデータ) (2023-07-06T08:14:54Z) - Robustness Testing for Multi-Agent Reinforcement Learning: State
Perturbations on Critical Agents [2.5204420653245245]
MARL(Multi-Agent Reinforcement Learning)は、スマート交通や無人航空機など、多くの分野に広く応用されている。
本研究は,MARLのための新しいロバストネステストフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-09T02:26:28Z) - Improved Policy Evaluation for Randomized Trials of Algorithmic Resource
Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。
我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文 参考訳(メタデータ) (2023-02-06T05:17:22Z) - RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in
Multi-Agent Deep Reinforcement Learning [55.55009081609396]
本稿では、アドホックな協調シナリオにおいてゼロショットの一般化を実現するRACA(Relation-Aware Credit Assignment)と呼ばれる新しい手法を提案する。
RACAは、エージェント間のトポロジ構造を符号化するために、グラフベースのエンコーダ関係を利用する。
提案手法は,StarCraftIIマイクロマネジメントベンチマークとアドホック協調シナリオのベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2022-06-02T03:39:27Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - Getting to Know One Another: Calibrating Intent, Capabilities and Trust
for Human-Robot Collaboration [13.895990928770459]
ロボットが直接意思を伝えることができない人間を支援するシナリオに焦点を当てる。
我々は、決定論的アプローチを採用し、この設定をモデル化するためのTICC-POMDPを提案する。
実験によって、我々のアプローチはシミュレーションと実際の被験者による研究の両方において、より良いチームパフォーマンスをもたらすことが示された。
論文 参考訳(メタデータ) (2020-08-03T08:04:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。