論文の概要: Implicitly Aligning Humans and Autonomous Agents through Shared Task Abstractions
- arxiv url: http://arxiv.org/abs/2505.04579v1
- Date: Wed, 07 May 2025 17:19:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:36.163009
- Title: Implicitly Aligning Humans and Autonomous Agents through Shared Task Abstractions
- Title(参考訳): タスク抽象化による人・自律エージェントの意図的調整
- Authors: Stéphane Aroca-Ouellette, Miguel Aroca-Ouellette, Katharina von der Wense, Alessandro Roncone,
- Abstract要約: HA$2$:階層的アドホックエージェント(hierarchical Ad Hoc Agents)は、階層的強化学習を利用して、人間が協調で使用する構造的アプローチを模倣するフレームワークである。
オーバークッキング環境におけるHA$2$の評価を行い、未確認エージェントと人間の両方と組み合わせた場合、既存のベースラインよりも統計的に有意な改善が見られた。
- 参考スコア(独自算出の注目度): 42.813774494968214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In collaborative tasks, autonomous agents fall short of humans in their capability to quickly adapt to new and unfamiliar teammates. We posit that a limiting factor for zero-shot coordination is the lack of shared task abstractions, a mechanism humans rely on to implicitly align with teammates. To address this gap, we introduce HA$^2$: Hierarchical Ad Hoc Agents, a framework leveraging hierarchical reinforcement learning to mimic the structured approach humans use in collaboration. We evaluate HA$^2$ in the Overcooked environment, demonstrating statistically significant improvement over existing baselines when paired with both unseen agents and humans, providing better resilience to environmental shifts, and outperforming all state-of-the-art methods.
- Abstract(参考訳): 共同作業では、自律的なエージェントは、新しいなじみのないチームメイトに迅速に適応する能力において、人間に劣る。
ゼロショット調整の制限要因は、人間がチームメイトと暗黙的に整合するために依存するメカニズムである共有タスクの抽象化の欠如である、と仮定する。
このギャップに対処するため,階層型アドホックエージェント(HA$^2$:hierarchical Ad Hoc Agents)を紹介した。
オーバークッキング環境におけるHA$^2$の評価を行い、未確認エージェントと人間の両方と組み合わせた場合の既存のベースラインよりも統計的に有意な改善を示し、環境変化に対するレジリエンスを向上し、全ての最先端手法よりも優れていることを示した。
関連論文リスト
- ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - Reward Machines for Cooperative Multi-Agent Reinforcement Learning [30.84689303706561]
協調型マルチエージェント強化学習において、エージェントの集合は共通の目標を達成するために共有環境で対話することを学ぶ。
本稿では、報酬関数の構造化表現として使われる単純な機械である報酬機械(RM)を用いて、チームのタスクを符号化する手法を提案する。
マルチエージェント設定におけるRMの新たな解釈は、要求されるチームメイト相互依存性を明示的に符号化し、チームレベルのタスクを個々のエージェントのサブタスクに分解することを可能にする。
論文 参考訳(メタデータ) (2020-07-03T23:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。