論文の概要: Adaptive Human-AI Coordination via Hierarchical Action Disentanglement
- arxiv url: http://arxiv.org/abs/2605.24343v1
- Date: Sat, 23 May 2026 01:59:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.942113
- Title: Adaptive Human-AI Coordination via Hierarchical Action Disentanglement
- Title(参考訳): 階層的行動歪曲による適応型ヒューマンAIコーディネーション
- Authors: Adnan Ahmad, Bahareh Nakisa, Mohammad Naim Rastgoo,
- Abstract要約: 人間とAIのコラボレーションには、多様なパートナーの行動やスキルレベルに適応できるエージェントが必要です。
Intrinsic Action Disentanglement (IAD) は階層的な強化学習フレームワークであり、ハイレベルな潜伏スキルを前提とした、パートナー対応の低レベルアクションシーケンスを学習する。
我々は,複数のレイアウトと多様なパートナー設定にまたがるオーバークッキングAI領域におけるIADの評価を行った。
- 参考スコア(独自算出の注目度): 1.4255659581428333
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human-AI collaboration requires agents that can adapt to diverse partner behaviors and skill levels while remaining robust to unseen partners. Existing methods often collapse to a single dominant behavior or learn poorly aligned skills, limiting effective coordination. We propose Intrinsic Action Disentanglement (IAD), a deep hierarchical reinforcement learning (DHRL) framework that learns distinct, partner-aware low-level action sequences conditioned on high-level latent skills. IAD introduces an intrinsic reward that explicitly encourages disentangled action distributions of the agent's low-level policy across skills, yielding an interpretable mapping between high-level decisions and partner-specific behavioral responses. By capturing temporally extended interaction patterns, IAD enables flexible adaptation to heterogeneous partner dynamics under distributional shift. We evaluate IAD in the Overcooked-AI domain across multiple layouts and diverse partner settings, including unseen simulated partners, a human-proxy model trained on human-human gameplay, and real human partners. Results show that IAD consistently outperforms strong baselines and achieves more reliable, adaptive coordination across all settings.
- Abstract(参考訳): 人間とAIのコラボレーションには、多様なパートナーの行動やスキルレベルに適応できるエージェントが必要です。
既存の手法は、多くの場合、単一の支配的な行動に崩壊するか、不整合のスキルを学び、効果的な調整を制限します。
Intrinsic Action Disentanglement (IAD) は,高レベルの潜伏スキルを前提とした,パートナー対応の低レベルアクションシーケンスを個別に学習するディープ階層型強化学習(DHRL)フレームワークである。
IADは本質的な報酬を導入し、エージェントのスキル横断的な低レベルポリシーのアンタングルされた行動分布を明示的に促進し、ハイレベル決定とパートナー固有の行動応答の解釈可能なマッピングを生成する。
時間的に拡張された相互作用パターンをキャプチャすることで、IDAは分散シフトの下で異種パートナーダイナミクスへの柔軟な適応を可能にする。
我々は,複数のレイアウトと多様なパートナー設定にまたがるオーバークッキングAI領域におけるIADの評価を行った。
結果は、IADが強いベースラインを一貫して上回り、すべての設定でより信頼性が高く適応的な調整を実現していることを示している。
関連論文リスト
- Partner-Aware Hierarchical Skill Discovery for Robust Human-AI Collaboration [1.4255659581428333]
マルチエージェントのコラボレーション、特に人間とAIのコラボレーションでは、多様な動的な振る舞いを持つ新しいパートナーに適応できるエージェントが必要である。
DHRLフレームワークであるPartner-Aware Skill Discovery (PASD)を導入する。
PASDは、パートナーのインタラクションから生まれるパターンをキャプチャし、類似のパートナ間でスキル表現を整合させ、多様な戦略間で差別性を維持するために、対照的な本質的な報酬を導入する。
論文 参考訳(メタデータ) (2026-05-23T02:26:46Z) - SynAgent: Generalizable Cooperative Humanoid Manipulation via Solo-to-Cooperative Agent Synergy [59.86199649493784]
制御可能な協調的ヒューマノイド操作は、インボディードインテリジェンスにとって根本的な問題である。
スケーラブルで物理的に妥当な協調操作を可能にするフレームワークであるSynAgentを提案する。
実験では、SynAgentは協調模倣と軌道条件制御の両方において既存のベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-04-20T17:46:20Z) - Unsupervised Partner Design Enables Robust Ad-hoc Teamwork [7.578942855148756]
Unsupervised Partner Design (UPD) は、ロバストなアドホックチームワークのためのマルチエージェント強化学習フレームワークである。
UPDは、エゴエージェントのポリシーをランダムパラメータと混合することで多様なパートナーを構築し、分散ベースの学習性メトリクスを用いてそれらをスコアする。
UPDは教師なし環境設計と統合可能であることを示す。
論文 参考訳(メタデータ) (2025-08-08T14:11:15Z) - CooT: Learning to Coordinate In-Context with Coordination Transformers [10.888155149916967]
コーディネーション・トランスフォーマー(Coordination Transformers, Coot)は、目に見えないパートナーに迅速に適応する、コンテキスト内協調フレームワークである。
cootは、人口ベースアプローチ、勾配ベースの微調整、メタRLにインスパイアされたコンテキスト適応方法など、ベースラインを一貫して上回る。
対照的に、cootは安定かつ迅速なインコンテクスト適応を実現し、人間の評価において最も効果的なコラボレータである。
論文 参考訳(メタデータ) (2025-06-30T06:45:39Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - A Hierarchical Approach to Population Training for Human-AI
Collaboration [20.860808795671343]
階層型強化学習(HRL)に基づくヒューマンAIコラボレーション手法を提案する。
本手法は,2人のプレイヤーによるオーバークッキングゲーム環境において,異なるプレイスタイルとスキルレベルを持つ新しいパートナに動的に適応できることを実証する。
論文 参考訳(メタデータ) (2023-05-26T07:53:12Z) - PECAN: Leveraging Policy Ensemble for Context-Aware Zero-Shot Human-AI
Coordination [52.991211077362586]
本研究では,集団におけるパートナーの多様性を高めるための政策アンサンブル手法を提案する。
そこで我々は,egoエージェントがパートナーの潜在的ポリシープリミティブを分析し,識別するためのコンテキスト認識手法を開発した。
このようにして、エゴエージェントは多様なパートナーとの共同作業において、より普遍的な協調行動を学ぶことができる。
論文 参考訳(メタデータ) (2023-01-16T12:14:58Z) - Conditional Imitation Learning for Multi-Agent Games [89.897635970366]
本研究では,条件付きマルチエージェント模倣学習の課題について考察する。
本稿では,スケーラビリティとデータ不足の難しさに対処する新しい手法を提案する。
我々のモデルは,egoやパートナエージェント戦略よりも低ランクなサブスペースを学習し,サブスペースに補間することで,新たなパートナ戦略を推論し,適応する。
論文 参考訳(メタデータ) (2022-01-05T04:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。