論文の概要: Selectively Providing Reliance Calibration Cues With Reliance Prediction
- arxiv url: http://arxiv.org/abs/2302.09995v1
- Date: Mon, 20 Feb 2023 14:15:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 15:15:00.157844
- Title: Selectively Providing Reliance Calibration Cues With Reliance Prediction
- Title(参考訳): 信頼度予測による信頼度校正手がかりの選択的提供
- Authors: Yosuke Fukuchi, Seiji Yamada
- Abstract要約: 信頼性校正キュー(RCC)を選択的に提供するPred-RCを提案する。
Pred-RCは認知信頼モデルを使用して、人間がエージェントにタスクを割り当てるかどうかを予測する。
我々は,人間とAIの協調作業においてPred-RCを試験し,RCCの削減による人的依存のキャリブレーションに成功した。
- 参考スコア(独自算出の注目度): 5.482532589225552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For effective collaboration between humans and intelligent agents that employ
machine learning for decision-making, humans must understand what agents can
and cannot do to avoid over/under-reliance. A solution to this problem is
adjusting human reliance through communication using reliance calibration cues
(RCCs) to help humans assess agents' capabilities. Previous studies typically
attempted to calibrate reliance by continuously presenting RCCs, and when an
agent should provide RCCs remains an open question. To answer this, we propose
Pred-RC, a method for selectively providing RCCs. Pred-RC uses a cognitive
reliance model to predict whether a human will assign a task to an agent. By
comparing the prediction results for both cases with and without an RCC,
Pred-RC evaluates the influence of the RCC on human reliance. We tested Pred-RC
in a human-AI collaboration task and found that it can successfully calibrate
human reliance with a reduced number of RCCs.
- Abstract(参考訳): 意思決定に機械学習を利用する人間とインテリジェントエージェントの効果的なコラボレーションには、過度な信頼を避けるために、人間は何が可能で何ができないのかを理解する必要がある。
この問題に対する解決策は、rcc(reliance calibration cues)を用いたコミュニケーションによる人間依存度調整であり、エージェントの能力を評価するのに役立つ。
従来の研究は通常、RCCを継続的に提示することで依存度を調整しようとしたが、いつエージェントがRCCを提供するべきかは未解決のままである。
そこで我々は,RCCを選択的に提供するためのPred-RCを提案する。
Pred-RCは認知信頼モデルを使用して、人間がエージェントにタスクを割り当てるかどうかを予測する。
両症例の予測結果とRCCの有無を比較することにより,Pred-RCはRCCが人的依存に与える影響を評価する。
我々は,人間とAIの協調作業においてPred-RCを試験し,RCCの削減による人的依存のキャリブレーションに成功した。
関連論文リスト
- Cross-Validation Conformal Risk Control [40.2365781482563]
コンフォーマルリスク制御(CRC)は、従来の点予測器にポストホックを適用してキャリブレーションを保証する手法である。
本稿では,従来のCRCの検証ではなく,クロスバリデーションに基づく新しいCRC手法を提案する。
CV-CRCは、設定された予測子の平均リスクに関する理論的保証を提供する。
論文 参考訳(メタデータ) (2024-01-22T14:26:02Z) - Incorporating Human Flexibility through Reward Preferences in Human-AI Teaming [14.250120245287109]
我々は、人間-AI PbRL協調ゲームを開発し、RLエージェントが、作業目標と人間の協調行動への嗜好を引き出すために、人間-AI PbRL協調ゲームを開発する。
このゲーム定式化では、まず、人間が一定のポリシーに従うか、RLエージェントをオンザフライで適応するかに基づいて、チームのパフォーマンスを評価するために、ヒューマンフレキシビリティの概念を導入する。
私たちはこの2つの側面に沿った特別なケースを強調します。それは、特定オーケストレーションと呼ばれ、人間は柔軟で、エージェントは人間のポリシーを完全にアクセスできます。
論文 参考訳(メタデータ) (2023-12-21T20:48:15Z) - Neuroadaptation in Physical Human-Robot Collaboration [34.73541717674098]
我々は,pHRCのための新しいクローズドループニューラプティブフレームワークを実証した。
我々は,ロボット戦略に適応するために,強化学習の助けを借りて,認知コンフリクト情報をクローズループ方式で適用した。
実験の結果,クローズドループに基づくニューロアダプティブ・フレームワークは認知的対立のレベルを下げることができた。
論文 参考訳(メタデータ) (2023-09-30T12:16:24Z) - Incentive-Theoretic Bayesian Inference for Collaborative Science [59.15962177829337]
未知のパラメータについて、プライベートな先行エージェントが存在する場合の仮説テストについて検討する。
エージェントの戦略行動によって明らかにされる情報を活用する統計的推論を行う方法を示す。
論文 参考訳(メタデータ) (2023-07-07T17:59:01Z) - Provably Efficient Iterated CVaR Reinforcement Learning with Function
Approximation and Human Feedback [57.6775169085215]
リスクに敏感な強化学習は、期待される報酬とリスクのバランスをとるポリシーを最適化することを目的としている。
本稿では,線形および一般関数近似の下で,CVaR(Iterated Conditional Value-at-Risk)を目標とする新しいフレームワークを提案する。
本稿では,この反復CVaR RLに対するサンプル効率の高いアルゴリズムを提案し,厳密な理論的解析を行う。
論文 参考訳(メタデータ) (2023-07-06T08:14:54Z) - Robustness Testing for Multi-Agent Reinforcement Learning: State
Perturbations on Critical Agents [2.5204420653245245]
MARL(Multi-Agent Reinforcement Learning)は、スマート交通や無人航空機など、多くの分野に広く応用されている。
本研究は,MARLのための新しいロバストネステストフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-09T02:26:28Z) - Improved Policy Evaluation for Randomized Trials of Algorithmic Resource
Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。
我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文 参考訳(メタデータ) (2023-02-06T05:17:22Z) - Bayes risk CTC: Controllable CTC alignment in Sequence-to-Sequence tasks [63.189632935619535]
予測アライメントの望ましい特性を強制するためにベイズリスクCTC(BRCTC)を提案する。
BRCTCを他の早期排出の選好と組み合わせることで、オンラインモデルの性能・遅延トレードオフが改善される。
論文 参考訳(メタデータ) (2022-10-14T03:55:36Z) - RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in
Multi-Agent Deep Reinforcement Learning [55.55009081609396]
本稿では、アドホックな協調シナリオにおいてゼロショットの一般化を実現するRACA(Relation-Aware Credit Assignment)と呼ばれる新しい手法を提案する。
RACAは、エージェント間のトポロジ構造を符号化するために、グラフベースのエンコーダ関係を利用する。
提案手法は,StarCraftIIマイクロマネジメントベンチマークとアドホック協調シナリオのベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2022-06-02T03:39:27Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - Getting to Know One Another: Calibrating Intent, Capabilities and Trust
for Human-Robot Collaboration [13.895990928770459]
ロボットが直接意思を伝えることができない人間を支援するシナリオに焦点を当てる。
我々は、決定論的アプローチを採用し、この設定をモデル化するためのTICC-POMDPを提案する。
実験によって、我々のアプローチはシミュレーションと実際の被験者による研究の両方において、より良いチームパフォーマンスをもたらすことが示された。
論文 参考訳(メタデータ) (2020-08-03T08:04:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。