Fugu-MT 論文翻訳(概要): Optimizing Delegation in Collaborative Human-AI Hybrid Teams

論文の概要: Optimizing Delegation in Collaborative Human-AI Hybrid Teams

arxiv url: http://arxiv.org/abs/2402.05605v1
Date: Thu, 8 Feb 2024 12:04:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-09 15:15:44.800587
Title: Optimizing Delegation in Collaborative Human-AI Hybrid Teams
Title（参考訳）: 協調型人間-AIハイブリッドチームにおけるデリゲーションの最適化
Authors: Andrew Fuchs, Andrea Passarella, and Marco Conti
Abstract要約: 我々は、1人のチームメンバー(コントロールエージェント)だけがチームのコントロールとして振る舞うことを許可されたハイブリッドチームのケースに対処する。チームの外部オブザーバとして学ぶAIマネージャの追加を提案する。我々は,人間ドライバーと自律運転システムからなるハイブリッドエージェントチームの場合をシミュレートした運転シナリオで,マネージャのパフォーマンスを実証した。
参考スコア（独自算出の注目度）: 1.433758865948252
License: http://creativecommons.org/licenses/by/4.0/
Abstract: When humans and autonomous systems operate together as what we refer to as a hybrid team, we of course wish to ensure the team operates successfully and effectively. We refer to team members as agents. In our proposed framework, we address the case of hybrid teams in which, at any time, only one team member (the control agent) is authorized to act as control for the team. To determine the best selection of a control agent, we propose the addition of an AI manager (via Reinforcement Learning) which learns as an outside observer of the team. The manager learns a model of behavior linking observations of agent performance and the environment/world the team is operating in, and from these observations makes the most desirable selection of a control agent. We restrict the manager task by introducing a set of constraints. The manager constraints indicate acceptable team operation, so a violation occurs if the team enters a condition which is unacceptable and requires manager intervention. To ensure minimal added complexity or potential inefficiency for the team, the manager should attempt to minimize the number of times the team reaches a constraint violation and requires subsequent manager intervention. Therefore our manager is optimizing its selection of authorized agents to boost overall team performance while minimizing the frequency of manager intervention. We demonstrate our manager performance in a simulated driving scenario representing the case of a hybrid team of agents composed of a human driver and autonomous driving system. We perform experiments for our driving scenario with interfering vehicles, indicating the need for collision avoidance and proper speed control. Our results indicate a positive impact of our manager, with some cases resulting in increased team performance up to ~187% that of the best solo agent performance.
Abstract（参考訳）: 人間と自律システムが協力してハイブリッドチームとして活動する場合、もちろん、チームが成功し、効果的に活動することを望みます。チームメンバーをエージェントと呼びます。提案したフレームワークでは、いつでもひとつのチームメンバー(コントロールエージェント)だけがチームのコントロールとして振る舞うことが許されるハイブリッドチームの状況に対処します。制御エージェントの最適な選択を決定するために、(強化学習を通じて)チームの外部オブザーバとして学習するaiマネージャを追加することを提案する。マネージャは、エージェントのパフォーマンスとチームが運用している環境/環境の観察をリンクする行動モデルを学び、これらの観察から最も望ましいコントロールエージェントを選択する。一連の制約を導入することで、マネージャのタスクを制限します。マネージャの制約は許容できるチームの操作を示すので、チームが受け入れがたい条件に入り、マネージャの介入を必要とする場合、違反が発生する。チームの複雑さや潜在的な非効率を最小にするために、マネージャは、チームが制約違反に到達した回数を最小にし、その後のマネージャの介入を要求すべきである。そのため、管理者の介入頻度を最小限に抑えつつ、チーム全体のパフォーマンスを高めるために権限のあるエージェントの選択を最適化しています。我々は,人間ドライバーと自律運転システムからなるハイブリッドエージェントチームの場合をシミュレートした運転シナリオで,マネージャのパフォーマンスを実証した。衝突回避と適切な速度制御の必要性を示唆し,車両間干渉による運転シナリオ実験を行った。結果としてチームのパフォーマンスが,最高のソロエージェントのパフォーマンスの約187%まで向上するケースもあります。

関連論文リスト

Multi-Agent Teams Hold Experts Back [37.015657067301355]
自己組織化LDMチームが強力なシナジーを達成できるかどうかを考察する。人間のチームとは違って、LLMチームは、専門家のエージェントのパフォーマンスと一貫して一致しないのです。私たちは、識別ではなく、専門家の活用が主要なボトルネックであることを示しています。
論文参考訳（メタデータ） (2026-02-01T04:34:36Z)
The Oversight Game: Learning to Cooperatively Balance an AI Agent's Safety and Autonomy [9.553819152637493]
エージェントが自律的に行動するか(プレイ)それとも延期するかを選択できる最小限の制御インタフェースについて検討する。エージェントがフェールした場合、人間の選択によって結果が決定され、修正アクションやシステム停止につながる可能性がある。本分析では,アライメント保証を提供するゲームクラスであるMarkov Potential Game (MPG) として,このゲームが適するケースに着目した。
論文参考訳（メタデータ） (2025-10-30T17:46:49Z)
When Should We Orchestrate Multiple Agents? [74.27052374196269]
人間と人工の両方の複数のエージェント間の相互作用を編成する戦略は、パフォーマンスを過大評価し、オーケストレーションのコストを過小評価する。推論コストや可用性制約といった現実的な条件下でエージェントを編成するフレームワークを設計する。我々は,エージェント間の性能差やコスト差がある場合にのみ,オーケストレーションが有効であることを理論的に示す。
論文参考訳（メタデータ） (2025-03-17T14:26:07Z)
Preventing Rogue Agents Improves Multi-Agent Collaboration [21.955058255432974]
本稿では,アクション予測中にエージェントを監視し,将来エラーが発生する可能性がある場合に介入することを提案する。 WhoDunitEnv、コード生成タスク、そしてリソース持続可能性のためのGovSim環境の実験は、我々のアプローチがパフォーマンスを大幅に向上させることを示している。
論文参考訳（メタデータ） (2025-02-09T18:35:08Z)
Optimizing Risk-averse Human-AI Hybrid Teams [1.433758865948252]
本稿では,標準化された強化学習スキームを通じて,最良デリゲート法を学習するマネージャを提案する。いくつかのグリッド環境において,マネージャのパフォーマンスの最適性を示す。結果から、マネージャは望ましいデリゲートをうまく習得でき、その結果、チームパスは、ほぼ、あるいは正確には最適であることがわかった。
論文参考訳（メタデータ） (2024-03-13T09:49:26Z)
Optimizing delegation between human and AI collaborative agents [1.6114012813668932]
私たちは、潜在的なパフォーマンス上の欠陥に関してデリゲート決定を行うために、デリゲートマネージャエージェントを訓練します。我々のフレームワークは、エージェントをマッチングのダイナミクスに制限することなく、チームパフォーマンスの観察を通して学習する。この結果から,環境の異なる表現の下で運用するエージェントチームによる委譲決定の実施をマネージャが学べることが判明した。
論文参考訳（メタデータ） (2023-09-26T07:23:26Z)
ProAgent: Building Proactive Cooperative Agents with Large Language Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。 ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。 ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文参考訳（メタデータ） (2023-08-22T10:36:56Z)
AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文参考訳（メタデータ） (2023-08-21T16:47:11Z)
Can Agents Run Relay Race with Strangers? Generalization of RL to Out-of-Distribution Trajectories [88.08381083207449]
異種エージェントの制御可能な状態に対する一般化失敗の有病率を示す。本稿では,学習中のQ関数に従って環境をエージェントの旧状態にリセットする,STA(Self-Trajectory Augmentation)という新しい手法を提案する。
論文参考訳（メタデータ） (2023-04-26T10:12:12Z)
Compensating for Sensing Failures via Delegation in Human-AI Hybrid Systems [0.0]
我々は、管理エージェントがいつ委任代行を行うかを特定することを任務とするハイブリッドな人間-AIチームについて考察する。我々は、環境コンテキストが知覚障害にどのように貢献するか、または悪化するかをモデル化する。本稿では,強化学習(RL)マネージャがコンテキストデリゲーションアソシエーションをいかに修正できるかを示す。
論文参考訳（メタデータ） (2023-03-02T14:27:01Z)
Task Allocation with Load Management in Multi-Agent Teams [4.844411739015927]
負荷管理を考慮したタスク割り当て学習のための多エージェントチームのための意思決定フレームワークを提案する。負荷管理がチームのパフォーマンスに与える影響を説明し、例のシナリオでエージェントの振る舞いを探る。コラボレーションにおけるエージェントの重要性の尺度は、潜在的な過負荷の状況に直面しているときにチームのレジリエンスを推測するために開発されます。
論文参考訳（メタデータ） (2022-07-17T20:17:09Z)
Learning to Transfer Role Assignment Across Team Sizes [48.43860606706273]
チーム規模で役割の割り当てと移譲を学ぶためのフレームワークを提案する。ロールベースの信用割当構造を再利用することで、より大きな強化学習チームの学習プロセスが促進されることを示す。
論文参考訳（メタデータ） (2022-04-17T11:22:01Z)
Coach-assisted Multi-Agent Reinforcement Learning Framework for Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。本稿では,教師支援型多エージェント強化学習フレームワークを提案する。私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文参考訳（メタデータ） (2022-03-16T08:22:45Z)
Coach-Player Multi-Agent Reinforcement Learning for Dynamic Team Composition [88.26752130107259]
現実世界のマルチエージェントシステムでは、異なる能力を持つエージェントがチーム全体の目標を変更することなく参加または離脱する可能性がある。この問題に取り組むコーチ・プレイヤー・フレームワーク「COPA」を提案します。 1)コーチと選手の両方の注意メカニズムを採用し、2)学習を正規化するための変動目標を提案し、3)コーチが選手とのコミュニケーションのタイミングを決定するための適応的なコミュニケーション方法を設計する。
論文参考訳（メタデータ） (2021-05-18T17:27:37Z)
Moody Learners -- Explaining Competitive Behaviour of Reinforcement Learning Agents [65.2200847818153]
競合シナリオでは、エージェントは動的環境を持つだけでなく、相手の行動に直接影響される。エージェントのQ値の観察は通常、その振る舞いを説明する方法であるが、選択されたアクション間の時間的関係は示さない。
論文参考訳（メタデータ） (2020-07-30T11:30:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。