Fugu-MT 論文翻訳(概要): Benchmarking Robustness and Generalization in Multi-Agent Systems: A Case Study on Neural MMO

論文の概要: Benchmarking Robustness and Generalization in Multi-Agent Systems: A Case Study on Neural MMO

arxiv url: http://arxiv.org/abs/2308.15802v1
Date: Wed, 30 Aug 2023 07:16:11 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-31 14:45:55.796336
Title: Benchmarking Robustness and Generalization in Multi-Agent Systems: A Case Study on Neural MMO
Title（参考訳）: マルチエージェントシステムにおけるロバスト性と一般化のベンチマーク:ニューラルMMOのケーススタディ
Authors: Yangkun Chen, Joseph Suarez, Junjie Zhang, Chenghui Yu, Bo Wu, Hanmo Chen, Hengman Zhu, Rui Du, Shanliang Qian, Shuai Liu, Weijun Hong, Jinke He, Yibing Zhang, Liang Zhao, Clare Zhu, Julian Togelius, Sharada Mohanty, Jiaxin Chen, Xiu Li, Xiaolong Zhu, Phillip Isola
Abstract要約: IJCAI 2022で開催されている第2回Neural MMOチャレンジの結果を報告する。この競合はマルチエージェントシステムの堅牢性と一般化をターゲットにしている。環境ラッパー、ベースライン、可視化ツール、そしてさらなる研究のための選択されたポリシーを含むベンチマークをオープンソースにします。
参考スコア（独自算出の注目度）: 50.58083807719749
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present the results of the second Neural MMO challenge, hosted at IJCAI 2022, which received 1600+ submissions. This competition targets robustness and generalization in multi-agent systems: participants train teams of agents to complete a multi-task objective against opponents not seen during training. The competition combines relatively complex environment design with large numbers of agents in the environment. The top submissions demonstrate strong success on this task using mostly standard reinforcement learning (RL) methods combined with domain-specific engineering. We summarize the competition design and results and suggest that, as an academic community, competitions may be a powerful approach to solving hard problems and establishing a solid benchmark for algorithms. We will open-source our benchmark including the environment wrapper, baselines, a visualization tool, and selected policies for further research.
Abstract（参考訳）: IJCAI 2022で開催されている第2回Neural MMOチャレンジの結果を報告する。参加者は、トレーニング中に見えない相手に対してマルチタスクの目標を達成するためにエージェントのチームを訓練します。競争は比較的複雑な環境設計と環境における多数のエージェントを組み合わせる。トップ投稿は、主に標準強化学習(rl)メソッドとドメイン特化工学を組み合わせることで、このタスクにおいて強力な成功を示しています。コンペティションの設計と結果を要約し,アカデミックコミュニティとしてのコンペティションは,難解な問題を解決し,アルゴリズムの堅実なベンチマークを確立するための強力なアプローチである可能性を示唆する。環境ラッパー、ベースライン、可視化ツール、そしてさらなる研究のための選択されたポリシーを含むベンチマークをオープンソースにします。

関連論文リスト

Online Submission and Evaluation System Design for Competition Operations [16.589706967125252]
本稿では,コンペティションの提出と評価を自動化するオンラインコンペティションシステムを提案する。このシステムは、グリッドベースのパスフィニングコンペティションやLeague of Robot Runnersコンペティションなど、いくつかのコンペティションですでに成功している。
論文参考訳（メタデータ） (2025-07-23T17:44:10Z)
AI Research Agents for Machine Learning: Search, Exploration, and Generalization in MLE-bench [65.21702462691933]
我々は、AI研究エージェントを候補ソリューションの空間をナビゲートする検索ポリシーとして形式化し、演算子を使ってそれらを反復的に修正する。我々の最良の探索戦略と演算子の組み合わせは、MLEベンチライトの最先端の成果を達成し、カグルメダルを39.6%から47.7%に引き上げることに成功した。
論文参考訳（メタデータ） (2025-07-03T11:59:15Z)
Symbolic Mixture-of-Experts: Adaptive Skill-based Routing for Heterogeneous Reasoning [76.10639521319382]
シンボリックなテキストベースでグラデーションのないMixture-of-ExpertsフレームワークであるSybolic-MoEを提案する。我々は,Sybolic-MoEのインスタンスレベルのエキスパート選択により,大きなマージンで性能が向上することを示した。
論文参考訳（メタデータ） (2025-03-07T18:03:13Z)
MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents [59.825725526176655]
大規模言語モデル(LLM)は、自律的なエージェントとして顕著な能力を示している。既存のベンチマークでは、単一エージェントタスクにフォーカスするか、狭いドメインに限定されており、マルチエージェントのコーディネーションと競合のダイナミクスを捉えていない。多様な対話シナリオにまたがってLLMベースのマルチエージェントシステムを評価するためのベンチマークであるMultiAgentBenchを紹介する。
論文参考訳（メタデータ） (2025-03-03T05:18:50Z)
FightLadder: A Benchmark for Competitive Multi-Agent Reinforcement Learning [25.857375787748715]
我々は、リアルタイムの格闘ゲームプラットフォームであるFightLadderを紹介し、競争力のあるMARL研究を促進する。競争ゲームのための最先端のMARLアルゴリズムの実装と評価指標のセットを提供する。シングルプレイヤーモードで12文字を連続的に打ち破る汎用エージェントを訓練することにより,このプラットフォームの実現可能性を示す。
論文参考訳（メタデータ） (2024-06-04T08:04:23Z)
CompeteSMoE -- Effective Training of Sparse Mixture of Experts via Competition [52.2034494666179]
スパース・ミックス・オブ・エキスパート(SMoE)は、ネットワークの深さや幅を増大させる平均を超えた、モデルの複雑さをスケールアップする魅力的なソリューションを提供する。本稿では,この表現崩壊の根本的な課題に対処する競合機構を提案する。入力を最も高い神経応答を持つ専門家にのみルーティングすることにより、コンペティションが最適推定器と同じ収束率を持つことを示す。
論文参考訳（メタデータ） (2024-02-04T15:17:09Z)
The NeurIPS 2022 Neural MMO Challenge: A Massively Multiagent Competition with Specialization and Trade [41.639843908635875]
NeurIPS-2022 Neural MMO Challengeには500人が参加し、1,600以上の応募があった。今年の競技は最新のv1.6 Neural MMOで行われ、新しい装備、戦闘、取引、より良いスコアシステムが導入されている。本稿では,課題の設計と成果を要約し,学習方法のベンチマークとして,この環境の可能性について考察する。
論文参考訳（メタデータ） (2023-11-07T04:14:45Z)
DIAMBRA Arena: a New Reinforcement Learning Platform for Research and Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文参考訳（メタデータ） (2022-10-19T14:39:10Z)
Retrospective on the 2021 BASALT Competition on Learning from Human Feedback [92.37243979045817]
競争の目的は、人間のフィードバック(LfHF)技術から学び、オープンワールドの課題を解決するエージェントへの研究を促進することであった。 LfHF技術の使用を義務付けるのではなく、ビデオゲームMinecraftで達成すべき自然言語の4つのタスクについて説明した。チームは、様々な可能な人間のフィードバックタイプにまたがる多様なLfHFアルゴリズムを開発した。
論文参考訳（メタデータ） (2022-04-14T17:24:54Z)
Towards robust and domain agnostic reinforcement learning competitions [12.731614722371376]
強化学習コンペティションは標準研究ベンチマークの基礎を形成している。それにもかかわらず、ほとんどの課題は、同じ根本的な問題に悩まされている。本稿では,これらの障壁を克服するアルゴリズムの開発を促進する,競争設計の新しい枠組みを提案する。
論文参考訳（メタデータ） (2021-06-07T16:15:46Z)
The MineRL 2020 Competition on Sample Efficient Reinforcement Learning using Human Priors [62.9301667732188]
我々は,MineRLコンペティションの第2イテレーションを提案する。競争の主な目標は、人間のデモンストレーションを効率的に活用できるアルゴリズムの開発を促進することです。コンペティションは、データセットと環境のペアバージョンが複数提供される2ラウンドで構成されている。各ラウンドの終わりに、競合他社はコンテナ化された学習アルゴリズムをaicrowdプラットフォームに提出する。
論文参考訳（メタデータ） (2021-01-26T20:32:30Z)
Forgetful Experience Replay in Hierarchical Reinforcement Learning from Demonstrations [55.41644538483948]
本稿では,複雑な視覚環境において,エージェントが低品質な実演を行えるようにするためのアプローチの組み合わせを提案する。提案した目標指向のリプレイバッファ構築により,エージェントはデモにおいて複雑な階層的タスクを解くためのサブゴールを自動的に強調することができる。私たちのアルゴリズムに基づくこのソリューションは、有名なMineRLコンペティションのすべてのソリューションを破り、エージェントがMinecraft環境でダイヤモンドをマイニングすることを可能にする。
論文参考訳（メタデータ） (2020-06-17T15:38:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。