Fugu-MT 論文翻訳(概要): Artificial Generals Intelligence: Mastering Generals.io with Reinforcement Learning

論文の概要: Artificial Generals Intelligence: Mastering Generals.io with Reinforcement Learning

arxiv url: http://arxiv.org/abs/2507.06825v2
Date: Thu, 10 Jul 2025 09:28:09 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-11 12:24:00.095774
Title: Artificial Generals Intelligence: Mastering Generals.io with Reinforcement Learning
Title（参考訳）: 人工知能:強化学習によるジェネラルズ.ioの習得
Authors: Matej Straka, Martin Schmid,
Abstract要約: 我々は,週に数千人のアクティブプレイヤーが参加するゲームであるGenerals.ioをベースとしたリアルタイム戦略ゲーム環境を導入する。我々の環境はGymnasiumやPettingZooと完全に互換性があり、コモディティハードウェア上で毎秒数千フレームを実行できる。
参考スコア（独自算出の注目度）: 3.5036467860577307
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: We introduce a real-time strategy game environment based on Generals.io, a game with thousands of weekly active players. Our environment is fully compatible with Gymnasium and PettingZoo and is capable of running thousands of frames per second on commodity hardware. We also present a reference agent, trained with supervised pre-training and self-play, which reached the top 0.003% of the 1v1 human leaderboard after only 36 hours on a single H100 GPU. To accelerate learning, we incorporate potential-based reward shaping and memory features. Our contributions of a modular RTS benchmark and a competitive baseline agent provide an accessible yet challenging platform for advancing multi-agent reinforcement learning research. The documented code, together with examples and tutorials, is available at https://github.com/strakam/generals-bots.
Abstract（参考訳）: 我々は,週に数千人のアクティブプレイヤーが参加するゲームであるGenerals.ioをベースとしたリアルタイム戦略ゲーム環境を導入する。我々の環境はGymnasiumやPettingZooと完全に互換性があり、コモディティハードウェア上で毎秒数千フレームを実行できる。また、1台のH100 GPUでわずか36時間で1v1人のリーダーボードのトップ0.003%に達した、教師付き事前トレーニングとセルフプレイでトレーニングされた参照エージェントも提示する。学習を加速するために、ポテンシャルに基づく報酬形成とメモリ機能を導入する。モジュールRTSベンチマークと競合するベースラインエージェントのコントリビューションは、マルチエージェント強化学習研究を進める上で、アクセス可能で困難なプラットフォームを提供する。ドキュメントコードとサンプルとチュートリアルはhttps://github.com/strakam/ generals-bots.comで公開されている。

関連論文リスト

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering [35.237253622981264]
MLE-benchは、AIエージェントが機械学習エンジニアリングでどのように機能するかを測定するためのベンチマークである。われわれはKaggleから75のMLエンジニアリング関連のコンペを開催する。私たちはKaggleが公開しているリーダーボードを使って、各競技の人間ベースラインを確立します。
論文参考訳（メタデータ） (2024-10-09T17:34:27Z)
Reinforcement Learning for High-Level Strategic Control in Tower Defense Games [47.618236610219554]
戦略ゲームにおいて、ゲームデザインの最も重要な側面の1つは、プレイヤーにとっての挑戦の感覚を維持することである。従来のスクリプティング手法と強化学習を組み合わせた自動手法を提案する。その結果、強化学習のような学習アプローチとスクリプトAIを組み合わせることで、AIのみを使用するよりも高性能で堅牢なエージェントが生まれることが示された。
論文参考訳（メタデータ） (2024-06-12T08:06:31Z)
DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。 AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文参考訳（メタデータ） (2023-12-05T08:07:32Z)
Neural MMO 2.0: A Massively Multi-task Addition to Massively Multi-agent Learning [36.03451274861878]
ニューラルMMO 2.0は強化学習研究のための大規模マルチエージェント環境である。フレキシブルなタスクシステムを備えており、ユーザーは幅広い目的や報酬のシグナルを定義できる。バージョン2.0は前バージョンを完全に書き直したもので、3倍の性能改善とCleanRLとの互換性がある。
論文参考訳（メタデータ） (2023-11-07T05:36:39Z)
Technical Challenges of Deploying Reinforcement Learning Agents for Game Testing in AAA Games [58.720142291102135]
本稿では,既存の自動ゲームテストソリューションに,スクリプト型ボットをベースとして,実験的な強化学習システムを追加する取り組みについて述べる。ゲーム制作において強化学習を活用するためのユースケースを示し、ゲームのために同じ旅をしたいと思う人なら誰でも遭遇する最大の時間をカバーしています。我々は、機械学習、特にゲーム生産において効果的なツールである強化学習を作るのに価値があり、必要であると考えるいくつかの研究指針を提案する。
論文参考訳（メタデータ） (2023-07-19T18:19:23Z)
TiZero: Mastering Multi-Agent Football with Curriculum Learning and Self-Play [19.98100026335148]
TiZeroは、スクラッチから学習する自己進化型マルチエージェントシステムである。これは、Google Research Footballの環境において、これまでのシステムよりはるかに優れている。
論文参考訳（メタデータ） (2023-02-15T08:19:18Z)
DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文参考訳（メタデータ） (2022-10-31T06:29:08Z)
Mastering the Game of No-Press Diplomacy via Human-Regularized Reinforcement Learning and Planning [95.78031053296513]
ノープレス外交(No-press Diplomacy)は、協力と競争の両方を含む複雑な戦略ゲームである。我々は、人間の模倣学習ポリシーに対する報酬最大化ポリシーを規則化する、DiL-piKLと呼ばれる計画アルゴリズムを導入する。 RL-DiL-piKLと呼ばれる自己再生強化学習アルゴリズムに拡張可能であることを示す。
論文参考訳（メタデータ） (2022-10-11T14:47:35Z)
On Efficient Reinforcement Learning for Full-length Game of StarCraft II [21.768578136029987]
本稿では,抽出されたマクロアクションとニューラルネットワークの階層構造を含む階層的RL手法について検討する。 64x64マップと制限単位を用いて、レベル1組込みAIに対して99%の勝利率を達成する。我々は、エージェントを不正なレベルAIに対して訓練し、レベル8、レベル9、レベル10のAIに対してそれぞれ96%、97%、94%の勝利率を達成するために、アーキテクチャを改善した。
論文参考訳（メタデータ） (2022-09-23T12:24:21Z)
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge [70.47759528596711]
私たちは、人気のMinecraftゲーム上に構築された新しいフレームワークであるMineDojoを紹介します。本稿では,学習報酬関数として,大規模な事前学習ビデオ言語モデルを活用する新しいエージェント学習アルゴリズムを提案する。我々のエージェントは、手動で設計した密なシェーピング報酬なしで、自由形式の言語で指定された様々なオープンエンドタスクを解くことができる。
論文参考訳（メタデータ） (2022-06-17T15:53:05Z)
TiKick: Toward Playing Multi-agent Football Full Games from Single-agent Demonstrations [31.596018856092513]
Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、学習ベースのAIシステムである。私たちの知る限りでは、Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、初めての学習ベースのAIシステムだ。
論文参考訳（メタデータ） (2021-10-09T08:34:58Z)
Applying supervised and reinforcement learning methods to create neural-network-based agents for playing StarCraft II [0.0]
本稿では,汎用的な教師付き強化学習でトレーニングしたStarCraft IIのフル2プレーヤマッチングを実現するニューラルネットワークアーキテクチャを提案する。本実装では,ゲーム内スクリプトボットと比較して,非自明な性能を実現している。
論文参考訳（メタデータ） (2021-09-26T20:08:10Z)
Neural MMO v1.3: A Massively Multiagent Game Environment for Training and Evaluating Neural Networks [48.5733173329785]
本稿では,MMOにインスパイアされたマルチエージェントゲーム環境であるNeural MMOを紹介する。分散インフラストラクチャとゲームIOという,AI研究のためのマルチエージェントシステムエンジニアリングにおける,より一般的な2つの課題について論じる。
論文参考訳（メタデータ） (2020-01-31T18:50:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。