Fugu-MT 論文翻訳(概要): Selectively Providing Reliance Calibration Cues With Reliance Prediction

論文の概要: Selectively Providing Reliance Calibration Cues With Reliance Prediction

arxiv url: http://arxiv.org/abs/2302.09995v1
Date: Mon, 20 Feb 2023 14:15:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-21 15:15:00.157844
Title: Selectively Providing Reliance Calibration Cues With Reliance Prediction
Title（参考訳）: 信頼度予測による信頼度校正手がかりの選択的提供
Authors: Yosuke Fukuchi, Seiji Yamada
Abstract要約: 信頼性校正キュー(RCC)を選択的に提供するPred-RCを提案する。 Pred-RCは認知信頼モデルを使用して、人間がエージェントにタスクを割り当てるかどうかを予測する。我々は,人間とAIの協調作業においてPred-RCを試験し,RCCの削減による人的依存のキャリブレーションに成功した。
参考スコア（独自算出の注目度）: 5.482532589225552
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: For effective collaboration between humans and intelligent agents that employ machine learning for decision-making, humans must understand what agents can and cannot do to avoid over/under-reliance. A solution to this problem is adjusting human reliance through communication using reliance calibration cues (RCCs) to help humans assess agents' capabilities. Previous studies typically attempted to calibrate reliance by continuously presenting RCCs, and when an agent should provide RCCs remains an open question. To answer this, we propose Pred-RC, a method for selectively providing RCCs. Pred-RC uses a cognitive reliance model to predict whether a human will assign a task to an agent. By comparing the prediction results for both cases with and without an RCC, Pred-RC evaluates the influence of the RCC on human reliance. We tested Pred-RC in a human-AI collaboration task and found that it can successfully calibrate human reliance with a reduced number of RCCs.
Abstract（参考訳）: 意思決定に機械学習を利用する人間とインテリジェントエージェントの効果的なコラボレーションには、過度な信頼を避けるために、人間は何が可能で何ができないのかを理解する必要がある。この問題に対する解決策は、rcc(reliance calibration cues)を用いたコミュニケーションによる人間依存度調整であり、エージェントの能力を評価するのに役立つ。従来の研究は通常、RCCを継続的に提示することで依存度を調整しようとしたが、いつエージェントがRCCを提供するべきかは未解決のままである。そこで我々は,RCCを選択的に提供するためのPred-RCを提案する。 Pred-RCは認知信頼モデルを使用して、人間がエージェントにタスクを割り当てるかどうかを予測する。両症例の予測結果とRCCの有無を比較することにより,Pred-RCはRCCが人的依存に与える影響を評価する。我々は,人間とAIの協調作業においてPred-RCを試験し,RCCの削減による人的依存のキャリブレーションに成功した。

関連論文リスト

R-Align: Enhancing Generative Reward Models through Rationale-Centric Meta-Judging [69.96389360650072]
解析精度は, 標準ラベルの精度を超えて, 下流RLHFの結果を高い精度で予測できることが示される。我々は,金の判断でトレーニングを増強し,合理的アライメントを明示的に監督するR-Alignを提案する。
論文参考訳（メタデータ） (2026-02-06T15:17:11Z)
CP-Guard: Malicious Agent Detection and Defense in Collaborative Bird's Eye View Perception [54.78412829889825]
コラボレーティブ・パーセプション(CP)は自動運転に有望な技術を示している。 CPでは、ego CAVは協力者からのメッセージを受信する必要があるため、悪意のあるエージェントによる攻撃が容易になる。我々は,各エージェントが協調ネットワーク内の悪意あるエージェントを正確に検出し,排除するための新しい方法である textbfCP-Guard を提案する。
論文参考訳（メタデータ） (2024-12-16T17:28:25Z)
Cross-Validation Conformal Risk Control [40.2365781482563]
コンフォーマルリスク制御(CRC)は、従来の点予測器にポストホックを適用してキャリブレーションを保証する手法である。本稿では,従来のCRCの検証ではなく,クロスバリデーションに基づく新しいCRC手法を提案する。 CV-CRCは、設定された予測子の平均リスクに関する理論的保証を提供する。
論文参考訳（メタデータ） (2024-01-22T14:26:02Z)
Incorporating Human Flexibility through Reward Preferences in Human-AI Teaming [14.250120245287109]
我々は、人間-AI PbRL協調ゲームを開発し、RLエージェントが、作業目標と人間の協調行動への嗜好を引き出すために、人間-AI PbRL協調ゲームを開発する。このゲーム定式化では、まず、人間が一定のポリシーに従うか、RLエージェントをオンザフライで適応するかに基づいて、チームのパフォーマンスを評価するために、ヒューマンフレキシビリティの概念を導入する。私たちはこの2つの側面に沿った特別なケースを強調します。それは、特定オーケストレーションと呼ばれ、人間は柔軟で、エージェントは人間のポリシーを完全にアクセスできます。
論文参考訳（メタデータ） (2023-12-21T20:48:15Z)
Neuroadaptation in Physical Human-Robot Collaboration [34.73541717674098]
我々は,pHRCのための新しいクローズドループニューラプティブフレームワークを実証した。我々は,ロボット戦略に適応するために,強化学習の助けを借りて,認知コンフリクト情報をクローズループ方式で適用した。実験の結果,クローズドループに基づくニューロアダプティブ・フレームワークは認知的対立のレベルを下げることができた。
論文参考訳（メタデータ） (2023-09-30T12:16:24Z)
Incentive-Theoretic Bayesian Inference for Collaborative Science [59.15962177829337]
未知のパラメータについて、プライベートな先行エージェントが存在する場合の仮説テストについて検討する。エージェントの戦略行動によって明らかにされる情報を活用する統計的推論を行う方法を示す。
論文参考訳（メタデータ） (2023-07-07T17:59:01Z)
Provably Efficient Iterated CVaR Reinforcement Learning with Function Approximation and Human Feedback [57.6775169085215]
リスクに敏感な強化学習は、期待される報酬とリスクのバランスをとるポリシーを最適化することを目的としている。本稿では,線形および一般関数近似の下で,CVaR(Iterated Conditional Value-at-Risk)を目標とする新しいフレームワークを提案する。本稿では,この反復CVaR RLに対するサンプル効率の高いアルゴリズムを提案し,厳密な理論的解析を行う。
論文参考訳（メタデータ） (2023-07-06T08:14:54Z)
Robustness Testing for Multi-Agent Reinforcement Learning: State Perturbations on Critical Agents [2.5204420653245245]
MARL(Multi-Agent Reinforcement Learning)は、スマート交通や無人航空機など、多くの分野に広く応用されている。本研究は,MARLのための新しいロバストネステストフレームワークを提案する。
論文参考訳（メタデータ） (2023-06-09T02:26:28Z)
Improved Policy Evaluation for Randomized Trials of Algorithmic Resource Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文参考訳（メタデータ） (2023-02-06T05:17:22Z)
Bayes risk CTC: Controllable CTC alignment in Sequence-to-Sequence tasks [63.189632935619535]
予測アライメントの望ましい特性を強制するためにベイズリスクCTC(BRCTC)を提案する。 BRCTCを他の早期排出の選好と組み合わせることで、オンラインモデルの性能・遅延トレードオフが改善される。
論文参考訳（メタデータ） (2022-10-14T03:55:36Z)
RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in Multi-Agent Deep Reinforcement Learning [55.55009081609396]
本稿では、アドホックな協調シナリオにおいてゼロショットの一般化を実現するRACA(Relation-Aware Credit Assignment)と呼ばれる新しい手法を提案する。 RACAは、エージェント間のトポロジ構造を符号化するために、グラフベースのエンコーダ関係を利用する。提案手法は,StarCraftIIマイクロマネジメントベンチマークとアドホック協調シナリオのベースライン手法よりも優れている。
論文参考訳（メタデータ） (2022-06-02T03:39:27Z)
COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。 1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文参考訳（メタデータ） (2020-10-30T00:47:01Z)
Getting to Know One Another: Calibrating Intent, Capabilities and Trust for Human-Robot Collaboration [13.895990928770459]
ロボットが直接意思を伝えることができない人間を支援するシナリオに焦点を当てる。我々は、決定論的アプローチを採用し、この設定をモデル化するためのTICC-POMDPを提案する。実験によって、我々のアプローチはシミュレーションと実際の被験者による研究の両方において、より良いチームパフォーマンスをもたらすことが示された。
論文参考訳（メタデータ） (2020-08-03T08:04:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。