論文の概要: Multi-party Agent Relation Sampling for Multi-party Ad Hoc Teamwork
- arxiv url: http://arxiv.org/abs/2510.25340v1
- Date: Wed, 29 Oct 2025 09:53:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.389269
- Title: Multi-party Agent Relation Sampling for Multi-party Ad Hoc Teamwork
- Title(参考訳): マルチパーティアドホックチームワークのためのマルチパーティエージェント関係サンプリング
- Authors: Beiwen Zhang, Yongheng Liang, Hejun Wu,
- Abstract要約: マルチパーティアドホックチームワーク(MAHT)を導入し、コントロールされたエージェントは、コントロールされていない複数のコントロールされていないチームメイトのグループと協調する必要がある。
MPE と starCralt ll の実験では、MARL はより速く収束しながら、MARL と AHT のベースラインより優れていた。
- 参考スコア(独自算出の注目度): 1.1011268090482575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent reinforcement learning (MARl) has achieved strong results in cooperative tasks but typically assumes fixed, fully controlled teams. Ad hoc teamwork (AHT) relaxes this by allowing collaboration with unknown partners, yet existing variants still presume shared conventions. We introduce Multil-party Ad Hoc Teamwork (MAHT), where controlled agents must coordinate with multiple mutually unfamiliar groups of uncontrolled teammates. To address this, we propose MARs, which builds a sparse skeleton graph and applies relational modeling to capture cross-group dvnamics. Experiments on MPE and starCralt ll show that MARs outperforms MARL and AHT baselines while converging faster.
- Abstract(参考訳): マルチエージェント強化学習(MARl)は協調作業において大きな成果を上げてきたが、通常は固定された完全に制御されたチームを想定している。
アドホックチームワーク(AHT)は、未知のパートナとのコラボレーションを可能にすることで、これを緩和する。
マルチパーティアドホックチームワーク(MAHT)を導入し、コントロールされたエージェントは、コントロールされていない複数のコントロールされていないチームメイトのグループと協調する必要がある。
そこで本研究では, スパーススケルトングラフを構築し, リレーショナルモデリングを適用して, グループ間dvnamicsをキャプチャするMARを提案する。
MPE と starCralt ll の実験では、MARL はより速く収束しながら、MARL と AHT のベースラインより優れていた。
関連論文リスト
- Generalizable Agent Modeling for Agent Collaboration-Competition Adaptation with Multi-Retrieval and Dynamic Generation [19.74776726500979]
ひとつのエージェントを新しいマルチエージェントシステムに適用することは、課題をもたらし、さまざまなタスク、環境、未知のチームメイトや相手とのインタラクションを調整する必要がある。
本稿では,多種多様なシナリオにまたがってエージェントを一般化するためのエージェント評価を行う,より包括的なエージェント協調適応手法を提案する。
ACCAでは、エージェントはタスクや環境の変化を調整し、目に見えないチームメイトと協力し、未知の相手と競う。
論文 参考訳(メタデータ) (2025-06-20T03:28:18Z) - ROTATE: Regret-driven Open-ended Training for Ad Hoc Teamwork [24.374221820972707]
Ad Hoc Teamwork(AHT)として知られるマルチエージェント学習の基本的な一般化課題である。
本稿では,AHTエージェントと対向チームメイトジェネレータ間のオープンエンド学習プロセスとして問題を再構築し,AHTの統一フレームワークを提案する。
多様な2人プレイ環境における実験は、ROTATEがチームメイトの評価の見当たらないセットに一般化する際に、ベースラインを著しく上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-29T17:24:54Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Group-Agent Reinforcement Learning [12.915860504511523]
複数の地理的に分散したエージェントがそれぞれのRLタスクを協調的に実行すれば、各エージェントの強化学習プロセスに大きく貢献できる。
グループエージェント強化学習(GARL)のための分散RLフレームワークDDAL(Decentralized Distributed Asynchronous Learning)を提案する。
論文 参考訳(メタデータ) (2022-02-10T16:40:59Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。