Fugu-MT 論文翻訳(概要): Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game

論文の概要: Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game

arxiv url: http://arxiv.org/abs/2605.23930v1
Date: Wed, 22 Apr 2026 00:55:08 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-15 07:09:36.478231
Title: Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game
Title（参考訳）: 量子フロッグ:量子時間協調ゲームにおける創発的協調と難易度スケーリング
Authors: Saad Mankarious,
Abstract要約: EmphQuantum Frogは,プレイヤの動作時にのみ環境が進行する,新しいアンファンタライズタイムメカニック上に構築された2人組の協調ゲームである。古典的なアーケードゲームFroggerにインスパイアされたQuantum Frogは、2羽のカエルが8ドル(約8,800円)のトラフィックを横切り、遠くに一緒に到達する必要がある。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce \emph{Quantum Frog}, a two-player cooperative game built on a novel \emph{quantized-time} mechanic in which the environment advances only when a player acts. Inspired by the classic arcade game Frogger, Quantum Frog requires two frogs to cross an 8$\times$8 grid of traffic and reach the far side together. We use reinforcement learning (RL) as an analytical lens to answer four design questions: (1) how does game difficulty scale with traffic density, (2) what is the optimal single-agent policy and why, (3) how large is the cooperation gap between independent and cooperative two-agent play, and (4) what joint strategy emerges when agents are incentivised to cooperate? We train agents through five escalating stages, Tabular Q-Learning, Deep Q-Network (\DQN), Independent \DQN~(\IDQN), and Multi-Agent Proximal Policy Optimisation (\MAPPO\ with a centralised critic), evaluating each against traffic densities of one to six cars. Our key findings are: (i) the quantized-time mechanic makes a \emph{rush strategy} (moving directly upward at every step) universally optimal, as time exposure to traffic is minimised; (ii) adding an uncoordinated second player is harder than sextupling the traffic for a single expert player; (iii) cooperative training recovers +32--34 percentage points of joint success rate relative to independent agents and reduces episode length from $\sim$90 to $\sim$6 steps; and (iv) the emergent cooperative strategy is synchronised rushing, not complex positional coordination, illustrating that shared incentives alone suffice to align agents in time-critical cooperative tasks. These findings provide concrete, empirically grounded guidance for the commercial design of Quantum Frog and offer broader insights into the role of environment mechanics in shaping multi-agent learning dynamics.
Abstract（参考訳）: 本稿では,プレイヤの動作時にのみ環境が進行する,小説『emph{quantized-time}』のメカニック上に構築された2人組の協調ゲームである『emph{Quantum Frog}』を紹介する。古典的なアーケードゲームFroggerにインスパイアされたQuantum Frogは、2羽のカエルが8$\times$8のトラフィックを横切り、遠くに一緒に到達する必要がある。分析レンズとして強化学習 (RL) を用いて,(1) ゲーム難易度は交通密度とどのようにスケールするか,(2) 最適な単一エージェント政策とは何なのか,(3) 独立系と協調型2エージェントプレイの協調的ギャップはどの程度大きいのか,(4) エージェントが協力を動機付けると共同戦略が現れるのか,といった4つの設計課題に答える。我々は、タブラルQラーニング、ディープQネットワークワーク(\DQN)、インディペンデント \DQN~(\IDQN)、マルチエージェントプロキシポリシー最適化(\MAPPO\)の5段階を通じてエージェントを訓練し、それぞれが1から6台の車の交通密度に対して評価する。私たちの主要な発見は次のとおりです。 (i) 量子化された時間力学は、交通への時間的露出を最小化するため、(各ステップで直接上向きに動く) \emph{rush 戦略を普遍的に最適にする。 (二)未調整の2人目のプレーヤーを加えることは、一人のエキスパートプレイヤーのトラフィックをセクタリングするより難しい。三協力訓練は、独立エージェントに対する共同成功率の+32--34パーセントを回復し、エピソードの長さを$\sim$90から$\sim$6ステップに短縮する。 (4) 創発的協調戦略は, 複雑な位置調整ではなく, エージェントを時間的にクリティカルな協調作業に整合させるのに十分なインセンティブの共有を図示する。これらの知見は,Quantum Frogの商業設計のための具体的基礎的なガイダンスを提供し,マルチエージェント学習のダイナミクスを形成する上での環境力学の役割についてより広範な知見を提供する。

関連論文リスト

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size [54.0714652192002]
物理に基づくヒューマノイド制御は、現実的でハイパフォーマンスな単一エージェントの動作を可能にするために顕著な進歩を遂げた。我々は,複数の協力エージェント間で協調的なHOIを処理するための,単一の分散政策を実現するためのフレームワークであるTeamHOIを提案する。
論文参考訳（メタデータ） (2026-03-09T05:52:13Z)
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play [27.908693831017786]
われわれはVolleyBotsという新しいロボットスポーツテストベッドを紹介した。複数のドローンが協力し、物理的なダイナミクスの下でバレーボールのスポーツで競う。 VolleyBotsは、競争的で協力的なゲームプレイ、ターンベースのインタラクション構造、アジャイル3D操作という、統合されたプラットフォームに3つの機能を統合する。
論文参考訳（メタデータ） (2025-02-04T02:07:23Z)
N-Agent Ad Hoc Teamwork [36.10108537776956]
協調的マルチエージェント行動の学習への現在のアプローチは、比較的限定的な設定を前提としている。本稿では,この問題を定式化し,エージェントモデリングを用いたポリシー最適化(POAM)アルゴリズムを提案する。 POAMは、NAHT問題に対するポリシーグラデーションであり、マルチエージェント強化学習アプローチであり、多様なチームメイト行動への適応を可能にする。
論文参考訳（メタデータ） (2024-04-16T17:13:08Z)
Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文参考訳（メタデータ） (2023-09-29T13:33:06Z)
MindAgent: Emergent Gaming Interaction [103.73707345211892]
大規模言語モデル(LLM)は、マルチエージェントシステムで複雑なスケジューリングを行う能力を持つ。我々はMindAgentを提案し,ゲームインタラクションにおける創発的能力の評価・調整を行う。
論文参考訳（メタデータ） (2023-09-18T17:52:22Z)
ProAgent: Building Proactive Cooperative Agents with Large Language Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。 ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。 ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文参考訳（メタデータ） (2023-08-22T10:36:56Z)
Decentralized Cooperative Multi-Agent Reinforcement Learning with Exploration [35.75029940279768]
マルコフチーム(Markov team)において、最も基本的な協調環境でマルチエージェント強化学習を研究する。本稿では,各エージェントが独立してステージベースのVラーニングスタイルのアルゴリズムを実行するアルゴリズムを提案する。エージェントは、少なくとも$proptowidetildeO (1/epsilon4)$ episodesにおいて、$epsilon$-approximate Nash平衡ポリシーを学ぶことができる。
論文参考訳（メタデータ） (2021-10-12T02:45:12Z)
Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。 CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (2020-10-16T17:42:11Z)
A Cordial Sync: Going Beyond Marginal Policies for Multi-Agent Embodied Tasks [111.34055449929487]
エージェントが協力して家具をリビングルームに移動させるという,新しいタスクFurnMoveを紹介した。既存のタスクとは異なり、FurnMoveはエージェントが各タイミングで調整する必要がある。既存の分散化されたアクションサンプリング手順は、表現力のある共同アクションポリシーを許さない。 SynC-policiesとCORDIALを用いて、我々のエージェントはFurnMoveで58%の完成率を達成する。
論文参考訳（メタデータ） (2020-07-09T17:59:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。