論文の概要: Feint in Multi-Player Games
- arxiv url: http://arxiv.org/abs/2403.07932v1
- Date: Mon, 4 Mar 2024 03:43:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-03-17 16:41:26.708322
- Title: Feint in Multi-Player Games
- Title(参考訳): マルチプレイヤーゲームにおけるポジション
- Authors: Junyu Liu, Wangkai Jin, Xiangjun Peng,
- Abstract要約: 本稿では,マルチプレイヤーゲームにおけるFeintの最初の形式化,実装,定量的評価について紹介する。
Feintの設計は,(1)ゲームからの報酬ゲインを大幅に改善し,(2)マルチプレイヤーゲームの多様性を著しく向上させ,(3)時間消費の面では無視できないオーバーヘッドしか生じないことを示す。
- 参考スコア(独自算出の注目度): 5.8871894658936395
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces the first formalization, implementation and quantitative evaluation of Feint in Multi-Player Games. Our work first formalizes Feint from the perspective of Multi-Player Games, in terms of the temporal, spatial, and their collective impacts. The formalization is built upon Non-transitive Active Markov Game Model, where Feint can have a considerable amount of impacts. Then, our work considers practical implementation details of Feint in Multi-Player Games, under the state-of-the-art progress of multi-agent modeling to date (namely Multi-Agent Reinforcement Learning). Finally, our work quantitatively examines the effectiveness of our design, and the results show that our design of Feint can (1) greatly improve the reward gains from the game; (2) significantly improve the diversity of Multi-Player Games; and (3) only incur negligible overheads in terms of time consumption. We conclude that our design of Feint is effective and practical, to make Multi-Player Games more interesting.
- Abstract(参考訳): 本稿では,マルチプレイヤーゲームにおけるFeintの最初の形式化,実装,定量的評価について紹介する。
我々の研究は、時間的、空間的、およびそれらの集団的影響の観点から、マルチプレイヤーゲームの観点から、最初にFeintを定式化する。
この形式化は、Feintが相当な影響力を持つことができる非推移的アクティブマルコフゲームモデルに基づいて構築されている。
そこで本稿では,現在までのマルチエージェントモデリング(いわゆるマルチエージェント強化学習)の最先端の進展の下で,マルチプレイヤーゲームにおけるFeintの実践的実装について検討する。
最後に,本研究は,デザインの有効性を定量的に検討し,フェントの設計は(1)ゲームから得られる報酬の獲得を大幅に改善すること,(2)マルチプレイヤーゲームの多様性を著しく改善すること,(3)時間消費の観点からは無視できないオーバーヘッドしか生じないことを示す。
We conclude that our design of Feint is effective and practical, to make multi-player Games。
関連論文リスト
- Enhancing Player Enjoyment with a Two-Tier DRL and LLM-Based Agent System for Fighting Games [41.463376100442396]
本研究では,古典的格闘ゲームStreet Fighter IIにおける2層エージェントシステムの提案と実験を行う。
TTAの第1層は、タスク指向ネットワークアーキテクチャ、モジュール化された報酬関数、および多様な技術を持つDRLエージェントを生成するためのハイブリッドトレーニングを採用している。
TTAの第2層では、プレイヤーのプレイデータとフィードバックを活用するLarge Language Model Hyper-Agentが、適切なDRL相手を動的に選択する。
論文 参考訳(メタデータ) (2025-04-10T03:38:06Z) - Model as a Game: On Numerical and Spatial Consistency for Generative Games [117.36098212829766]
本稿では,モデル・アズ・ア・ゲーム(MaaG)のメカニズムを十分に構築した上で,モデル・アズ・ア・ゲーム(MaaG)を真に構成するものを探るため,生成ゲームのパラダイムを再考する。
DiTアーキテクチャに基づいて,(1) LogicNetを統合してイベントトリガを決定する数値モジュール,(2) 探索領域のマップを維持する空間モジュール,(2) 生成中の位置情報を検索して連続性を確保する,という2つの特殊なモジュールを設計する。
論文 参考訳(メタデータ) (2025-03-27T05:46:15Z) - Ranking Joint Policies in Dynamic Games using Evolutionary Dynamics [0.0]
単純な2プレイヤーゲームでもエージェントの相互作用のダイナミクスはナッシュ平衡に達することができないことが示されている。
我々のゴールは、安定した行動をもたらすエージェントの合同戦略を特定し、変化に抵抗すると同時に、エージェントの支払いも考慮することである。
論文 参考訳(メタデータ) (2025-02-20T16:50:38Z) - player2vec: A Language Modeling Approach to Understand Player Behavior in Games [2.2216044069240657]
過去の行動ログから潜在ユーザ表現を学習する手法は、eコマース、コンテンツストリーミング、その他の設定におけるレコメンデーションタスクの注目を集めている。
本稿では,長距離トランスフォーマーモデルをプレイヤーの行動データに拡張することで,この制限を克服する新しい手法を提案する。
ゲームにおける行動追跡の具体性について議論し,文中の単語に類似した方法でゲーム内イベントを視聴することで,前処理とトークン化のアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-05T17:29:47Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - Offline Imitation of Badminton Player Behavior via Experiential Contexts and Brownian Motion [19.215240805688836]
RallyNetは、バドミントンプレーヤーの振る舞いに対する階層的なオフライン模倣学習モデルである。
我々はRallyNetを世界最大規模のバドミントンデータセットで広く検証する。
その結果、オフラインの模倣学習法や最先端のターンベースアプローチよりもRallyNetの方が優れていることが明らかになった。
論文 参考訳(メタデータ) (2024-03-19T03:34:23Z) - Reward Shaping for Improved Learning in Real-time Strategy Game Play [0.3347089492811693]
適切な設計の報酬形成機能により、プレイヤーのパフォーマンスを大幅に向上させることができることを示す。
本研究は,海中キャプチャー・ザ・フラッグゲームのための模擬環境下での報酬形成機能を検証した。
論文 参考訳(メタデータ) (2023-11-27T21:56:18Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - Generating Personas for Games with Multimodal Adversarial Imitation
Learning [47.70823327747952]
強化学習は、人間のレベルでゲームをすることができるエージェントを生産する上で、広く成功している。
強化学習を超えて進むことは、幅広い人間のプレイスタイルをモデル化するために必要である。
本稿では,プレイテストのための複数のペルソナポリシーを生成するための,新しい模倣学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-15T06:58:19Z) - Beyond the Meta: Leveraging Game Design Parameters for Patch-Agnostic
Esport Analytics [4.1692797498685685]
スポーツゲームは世界のゲーム市場の相当な割合を占めており、ゲームの中では最速の成長セグメントである。
伝統的なスポーツと比較して、エスポートのタイトルは、メカニックやルールの観点から急速に変化する。
本稿では,ゲームデザイン(パッチノートなど)から情報を抽出し,クラスタリング手法を用いて文字表現の新たな形式を提案する。
論文 参考訳(メタデータ) (2023-05-29T11:05:20Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Where Will Players Move Next? Dynamic Graphs and Hierarchical Fusion for
Movement Forecasting in Badminton [6.2405734957622245]
我々は、どのタイプのリターンストロークが作られるか、またプレイヤーが以前のストロークに基づいてどこに移動するかを予測することに重点を置いている。
既存のシーケンスベースのモデルはプレイヤー間の相互作用の影響を無視し、グラフベースのモデルは依然として多面的視点に悩まされている。
本稿では,対話型抽出器を用いた動的グラフと階層型移動予測モデル(DyMF)を提案する。
論文 参考訳(メタデータ) (2022-11-22T12:21:24Z) - Off-Beat Multi-Agent Reinforcement Learning [62.833358249873704]
オフビート動作が一般的環境におけるモデルフリーマルチエージェント強化学習(MARL)について検討した。
モデルレスMARLアルゴリズムのための新しいエピソードメモリLeGEMを提案する。
我々は,Stag-Hunter Game,Quarry Game,Afforestation Game,StarCraft IIマイクロマネジメントタスクなど,オフビートアクションを伴うさまざまなマルチエージェントシナリオ上でLeGEMを評価する。
論文 参考訳(メタデータ) (2022-05-27T02:21:04Z) - TiKick: Toward Playing Multi-agent Football Full Games from Single-agent
Demonstrations [31.596018856092513]
Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、学習ベースのAIシステムである。
私たちの知る限りでは、Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、初めての学習ベースのAIシステムだ。
論文 参考訳(メタデータ) (2021-10-09T08:34:58Z) - Pick Your Battles: Interaction Graphs as Population-Level Objectives for
Strategic Diversity [49.68758494467258]
我々は、集団内の個人がどのように相互作用するかを慎重に構造化することで、多様なエージェントの集団を構築する方法について研究する。
我々のアプローチは,エージェント間の情報の流れを制御するインタラクショングラフに基づいている。
マルチエージェント・トレーニングにおける多様性の重要性を証明し,様々な相互作用グラフを適用したゲームにおけるトレーニング・トラジェクトリ,多様性,パフォーマンスに与える影響を解析する。
論文 参考訳(メタデータ) (2021-10-08T11:29:52Z) - Predicting the outcome of team movements -- Player time series analysis
using fuzzy and deep methods for representation learning [0.0]
我々は、より拡張された一連の動きや戦術計画において、短い戦術と宇宙占領の有用なエンコーディングのためのフレームワークを提供する。
本稿では,2015-16シーズンのプロバスケットボールSportVUデータセットにおける予測・認識タスクに対する提案手法の有効性について検討する。
論文 参考訳(メタデータ) (2021-09-13T18:42:37Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - baller2vec: A Multi-Entity Transformer For Multi-Agent Spatiotemporal
Modeling [17.352818121007576]
マルチエージェント・テンポラリ・モデリングは,アルゴリズム設計の観点からも,計算の観点からも難しい課題である。
本稿では,標準トランスフォーマーの多元性一般化である Baller2vec について紹介する。
バスケットボールに関連する2つのタスクを訓練し,マルチエージェント・テンポラル・モデリングにおける Baller2vec の有効性を検証した。
論文 参考訳(メタデータ) (2021-02-05T17:02:04Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Neural MMO v1.3: A Massively Multiagent Game Environment for Training
and Evaluating Neural Networks [48.5733173329785]
本稿では,MMOにインスパイアされたマルチエージェントゲーム環境であるNeural MMOを紹介する。
分散インフラストラクチャとゲームIOという,AI研究のためのマルチエージェントシステムエンジニアリングにおける,より一般的な2つの課題について論じる。
論文 参考訳(メタデータ) (2020-01-31T18:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。