論文の概要: Beyond Partner Diversity: An Influence-Based Team Steering Framework for Zero-Shot Human-Machine Teaming
- arxiv url: http://arxiv.org/abs/2605.15400v1
- Date: Thu, 14 May 2026 20:34:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.09585
- Title: Beyond Partner Diversity: An Influence-Based Team Steering Framework for Zero-Shot Human-Machine Teaming
- Title(参考訳): パートナーの多様性を超えて - ゼロショットのヒューマンマシンチームのための影響ベースのチームステアリングフレームワーク
- Authors: Wei Sheng, Rohan Paleja,
- Abstract要約: インフルエンスベースのチームステアリングは、インフルエンスシェーピングを使用してエージェントにインセンティブを与え、多様なハイパフォーマンスなチームインタラクションパターンを見つけるフレームワークである。
IBTSは2エージェントと3エージェントの両方でOvercooked-AI上で評価し、学習された協調構造がダイアド相互作用を超えて移動するかどうかを検証した。
我々の評価には、シミュレートされたパートナー、合成パートナースタイルのバリエーション、そして私たちの知る限り、2人の真の人間チームメイトと1人のマシンチームメイトを含む30件のOvercooked-AI HMT研究が含まれている。
- 参考スコア(独自算出の注目度): 1.6672631924542791
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While AI agents are rapidly advancing from isolated tools to interactive collaborators, data-driven human-machine teaming (HMT) methods remain costly in their reliance on human interaction data across domains, teammates, and team sizes. Zero-shot coordination (ZSC) addresses this bottleneck by simulating diverse partner populations to approximate how unseen partners might behave. However, partner coverage alone is insufficient as team settings scale and communication becomes degraded. To remedy this deficiency, we propose Influence-Based Team Steering (IBTS), a framework that uses influence shaping to incentivize agents to discover diverse, high-performing team interaction patterns and further steers ongoing trajectories toward stronger learned coordination modes. We assess IBTS on Overcooked-AI in both two-agent and three-agent settings, allowing us to test whether learned coordination structure transfers beyond dyadic interaction. Our evaluation includes simulated partners, synthetic partner-style variation, and, to our knowledge, the first 30-subject Overcooked-AI HMT study involving two real human teammates and one machine teammate. Across these evaluations, IBTS improves team performance against competing baselines, highlighting the need for scaled ZSC to combine sparse-reward coordination mechanisms with partner-variation coverage rather than relying on diversity alone.
- Abstract(参考訳): AIエージェントは、孤立したツールからインタラクティブなコラボレータへと急速に進歩していますが、データ駆動型ヒューマンマシンチーム(HMT)メソッドは、ドメイン、チームメイト、チームサイズを越えたヒューマンインタラクションデータに依存するため、コストがかかります。
ゼロショットコーディネート(ZSC)は、多様なパートナー集団をシミュレートして、目に見えないパートナーの振る舞いを近似することで、このボトルネックに対処する。
しかし、チーム設定がスケールし、コミュニケーションが劣化するにつれて、パートナーのカバレッジだけでは不十分です。
エージェントのインフルエンス・シェーピングを利用して、多様なハイパフォーマンスなチームインタラクションパターンを発見し、さらに学習されたコーディネーション・モードに向けて進行する軌道を推し進めるフレームワークであるIBTSを提案する。
IBTSは2エージェントと3エージェントの両方でOvercooked-AI上で評価し、学習された協調構造がダイアド相互作用を超えて移動するかどうかを検証した。
我々の評価には、シミュレートされたパートナー、合成パートナースタイルのバリエーション、そして私たちの知る限り、2人の真の人間チームメイトと1人のマシンチームメイトを含む30件のOvercooked-AI HMT研究が含まれている。
これらの評価全体を通じて、IBTSは競合するベースラインに対するチームパフォーマンスを改善し、多様性のみに頼るのではなく、スパース・リワード調整機構とパートナ・バラエティカバレッジを組み合わせたスケールドZSCの必要性を強調している。
関連論文リスト
- TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size [54.0714652192002]
物理に基づくヒューマノイド制御は、現実的でハイパフォーマンスな単一エージェントの動作を可能にするために顕著な進歩を遂げた。
我々は,複数の協力エージェント間で協調的なHOIを処理するための,単一の分散政策を実現するためのフレームワークであるTeamHOIを提案する。
論文 参考訳(メタデータ) (2026-03-09T05:52:13Z) - Nested Training for Mutual Adaptation in Human-AI Teaming [30.247046563601202]
既存のアプローチは、トレーニングパートナの多様性を改善して人間の振る舞いを近似することを目的としているが、これらのパートナは静的であり、人間の適応的な振る舞いを捉えることができない。
我々は,人間ロボットのチーム化シナリオを対話的部分観測可能なマルコフ決定プロセス (I-POMDP) としてモデル化し,その状態の一部としての人間の適応を明示的にモデル化する。
提案手法を,人間ロボットの協調作業用に設計された複数のベースラインエージェントと比較し,オーバークッキング領域における協調設定を必要とするマルチフェーズで学習する。
論文 参考訳(メタデータ) (2026-02-18T23:07:48Z) - CooT: Learning to Coordinate In-Context with Coordination Transformers [10.888155149916967]
コーディネーション・トランスフォーマー(Coordination Transformers, Coot)は、目に見えないパートナーに迅速に適応する、コンテキスト内協調フレームワークである。
cootは、人口ベースアプローチ、勾配ベースの微調整、メタRLにインスパイアされたコンテキスト適応方法など、ベースラインを一貫して上回る。
対照的に、cootは安定かつ迅速なインコンテクスト適応を実現し、人間の評価において最も効果的なコラボレータである。
論文 参考訳(メタデータ) (2025-06-30T06:45:39Z) - Generalizable Agent Modeling for Agent Collaboration-Competition Adaptation with Multi-Retrieval and Dynamic Generation [19.74776726500979]
ひとつのエージェントを新しいマルチエージェントシステムに適用することは、課題をもたらし、さまざまなタスク、環境、未知のチームメイトや相手とのインタラクションを調整する必要がある。
本稿では,多種多様なシナリオにまたがってエージェントを一般化するためのエージェント評価を行う,より包括的なエージェント協調適応手法を提案する。
ACCAでは、エージェントはタスクや環境の変化を調整し、目に見えないチームメイトと協力し、未知の相手と競う。
論文 参考訳(メタデータ) (2025-06-20T03:28:18Z) - Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [50.657070334404835]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文 参考訳(メタデータ) (2024-12-20T09:21:15Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Towards Few-shot Coordination: Revisiting Ad-hoc Teamplay Challenge In
the Game of Hanabi [15.917861586043813]
現状のZSCアルゴリズムは、異なる学習手法で訓練されたエージェントとペアリングした場合、性能が劣っていることを示す。
我々は,MARL手法の適応性を評価するために,ハナビと呼ばれる人気のある協調型マルチエージェントゲームに基づくフレームワークを構築した。
論文 参考訳(メタデータ) (2023-08-20T14:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。