Fugu-MT 論文翻訳(概要): Transformer Guided Coevolution: Improved Team Formation in Multiagent Adversarial Games

論文の概要: Transformer Guided Coevolution: Improved Team Formation in Multiagent Adversarial Games

arxiv url: http://arxiv.org/abs/2410.13769v2
Date: Thu, 31 Oct 2024 23:59:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.053028
Title: Transformer Guided Coevolution: Improved Team Formation in Multiagent Adversarial Games
Title（参考訳）: Transformer Guided Coevolution: Multiagent Adversarial Gamesにおけるチーム形成の改善
Authors: Pranav Rajbhandari, Prithviraj Dasgupta, Donald Sofge,
Abstract要約: そこで本稿では,Masked Language Modelトレーニングを用いたトランスフォーマーに基づくディープニューラルネットワークを用いて,トレーニング対象者の最適なチームを選択するアルゴリズムを提案する。我々は,マルチエージェント対逆ゲーム「Marine Capture-The-Flag」で本アルゴリズムを検証した結果,BERTeam が非自明なチーム構成を学習し,見知らぬ相手に対して良好に動作していることが判明した。
参考スコア（独自算出の注目度）: 1.2338485391170533
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We consider the problem of team formation within multiagent adversarial games. We propose BERTeam, a novel algorithm that uses a transformer-based deep neural network with Masked Language Model training to select the best team of players from a trained population. We integrate this with coevolutionary deep reinforcement learning, which trains a diverse set of individual players to choose teams from. We test our algorithm in the multiagent adversarial game Marine Capture-The-Flag, and we find that BERTeam learns non-trivial team compositions that perform well against unseen opponents. For this game, we find that BERTeam outperforms MCAA, an algorithm that similarly optimizes team formation.
Abstract（参考訳）: マルチエージェント対戦ゲームにおけるチーム形成の問題点を考察する。本研究では,Masked Language Model を用いたトランスフォーマーベースディープニューラルネットワークを用いた新しいアルゴリズム BERTeam を提案する。私たちはこれを進化的な深層強化学習と統合し、チームの中から個々のプレイヤーを選ばせるように訓練します。我々は,マルチエージェント対逆ゲーム「Marine Capture-The-Flag」で本アルゴリズムを検証した結果,BERTeam が非自明なチーム構成を学習し,見知らぬ相手に対して良好に動作していることが判明した。このゲームでは、BERTeamがMCAAよりも優れており、同様にチーム形成を最適化するアルゴリズムである。

関連論文リスト

PillagerBench: Benchmarking LLM-Based Agents in Competitive Minecraft Team Environments [48.892997022500765]
PillagerBenchは、Minecraftのリアルタイムの競合チーム-vs-チームシナリオでマルチエージェントシステムを評価するフレームワークである。また,LLMベースのマルチエージェントシステムであるTactiCrafterを提案する。評価の結果、TactiCrafterはベースラインのアプローチよりも優れており、自己学習による適応学習を誇示している。
論文参考訳（メタデータ） (2025-09-07T22:51:12Z)
A Benchmark for Generalizing Across Diverse Team Strategies in Competitive Pokémon [31.012853711707965]
Pok'emon Video Game Championships (VGC) は、チーム構成が極端に広い領域である。重要なインフラストラクチャを提供し、評価プロトコルを標準化し、ヒューマンプレイデータセットを提供するベンチマークであるVGC-Benchを紹介します。エージェントが単一チーム構成でトレーニングされ評価される制限された環境では、我々のメソッドはプロのVGC競合相手に勝つことができる。
論文参考訳（メタデータ） (2025-06-12T03:19:39Z)
Multi-agent Multi-armed Bandits with Stochastic Sharable Arm Capacities [69.34646544774161]
我々は、各アームへのリクエストの到着とプレイヤーへのリクエストの割り当てポリシーをキャプチャするマルチプレイヤーマルチアーム・バンディット(MAB)モデルの新しいバリエーションを定式化する。課題は、プレイヤーが最適な腕引きプロファイルに従って腕を選択するように分散学習アルゴリズムを設計する方法である。我々は,Mラウンドのみの最適腕引きプロファイルにおいて,プレイヤーがコンセンサスに達することを保証した反復分散アルゴリズムを設計する。
論文参考訳（メタデータ） (2024-08-20T13:57:00Z)
Adapting to Teammates in a Cooperative Language Game [1.082078800505043]
本稿では,コードネームを再生するための適応エージェントを提案する。私たちは、特定のチームメイトと対話する過程において、内部の専門家エージェントのどちらがベストマッチであるかを決定するために、アンサンブルアプローチを採用しています。実験的な分析によると、このアンサンブルアプローチは個々のチームメイトに適応し、しばしばチームメイトにとって最高の内部エキスパートと同等に機能する。
論文参考訳（メタデータ） (2024-02-26T23:15:07Z)
Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文参考訳（メタデータ） (2024-01-10T12:56:24Z)
All by Myself: Learning Individualized Competitive Behaviour with a Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2023-10-02T08:11:07Z)
Value-based CTDE Methods in Symmetric Two-team Markov Game: from Cooperation to Team Competition [3.828689444527739]
混合協調競争環境における協調的価値ベース手法の評価を行った。集中型トレーニングと分散型実行パラダイムに基づく3つのトレーニング手法を選択した。実験では、StarCraft Multi-Agent Challenge環境を変更して、両チームが同時に学び、競争できる競争環境を作りました。
論文参考訳（メタデータ） (2022-11-21T22:25:55Z)
Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文参考訳（メタデータ） (2022-03-10T02:37:39Z)
Offsetting Unequal Competition through RL-assisted Incentive Schemes [18.57907480363166]
本稿では,不平等な専門知識を持つ組織間の競争のダイナミクスについて検討する。 We design Touch-Mark, a game based on well-known multi-agent- Particle-environment。
論文参考訳（メタデータ） (2022-01-05T04:47:22Z)
Learning Connectivity-Maximizing Network Configurations [123.01665966032014]
本稿では、専門家からコミュニケーションエージェントを配置することを学ぶ畳み込みニューラルネットワーク(CNN)を用いた教師あり学習手法を提案する。我々は,標準ライントポロジやリングトポロジ,ランダムに生成された105万件のテストケース,トレーニング中に見えない大規模なチームについて,CNNのパフォーマンスを実証した。トレーニング後,本システムは10～20名のエージェントの最適化手法よりも2桁高速な接続構成を生成する。
論文参考訳（メタデータ） (2021-12-14T18:59:01Z)
Coach-Player Multi-Agent Reinforcement Learning for Dynamic Team Composition [88.26752130107259]
現実世界のマルチエージェントシステムでは、異なる能力を持つエージェントがチーム全体の目標を変更することなく参加または離脱する可能性がある。この問題に取り組むコーチ・プレイヤー・フレームワーク「COPA」を提案します。 1)コーチと選手の両方の注意メカニズムを採用し、2)学習を正規化するための変動目標を提案し、3)コーチが選手とのコミュニケーションのタイミングを決定するための適応的なコミュニケーション方法を設計する。
論文参考訳（メタデータ） (2021-05-18T17:27:37Z)
CRICTRS: Embeddings based Statistical and Semi Supervised Cricket Team Recommendation System [6.628230604022489]
クリケットのためのチームレコメンデーションシステムを構築するための半教師付き統計手法を提案する。我々は,対戦相手の強みを考慮した質的,定量的な評価システムを設計し,演奏者のパフォーマンスを評価する。また、チーム内の打者やボーラーの数を含むチーム構成の重要な側面にも取り組みます。
論文参考訳（メタデータ） (2020-10-26T15:35:44Z)
Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文参考訳（メタデータ） (2020-09-21T17:51:57Z)
Natural Emergence of Heterogeneous Strategies in Artificially Intelligent Competitive Teams [0.0]
我々はFortAttackと呼ばれる競合するマルチエージェント環境を開発し、2つのチームが互いに競合する。このような振る舞いがチームの成功に繋がる場合、同種エージェント間の異種行動の自然発生を観察する。我々は、進化した反対戦略を利用して、友好的なエージェントのための単一のポリシーを訓練するアンサンブルトレーニングを提案する。
論文参考訳（メタデータ） (2020-07-06T22:35:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。