論文の概要: Playing Non-Embedded Card-Based Games with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2504.04783v1
- Date: Mon, 07 Apr 2025 07:26:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:10:20.778607
- Title: Playing Non-Embedded Card-Based Games with Reinforcement Learning
- Title(参考訳): 強化学習による非埋め込みカードベースゲーム
- Authors: Tianyang Wu, Lipeng Wan, Yuhang Wang, Qiang Wan, Xuguang Lan,
- Abstract要約: 本稿では,RTSゲームClash Royaleにおいて,リアルタイムな自律型ゲームプレイを実現するために,非埋め込み型オフライン強化学習トレーニング戦略を提案する。
我々は、最先端のオブジェクト検出と光学的文字認識モデルを用いて特徴を抽出する。
提案手法により,リアルタイム画像取得,認識機能融合,意思決定,モバイルデバイスの制御が可能となり,組込みAI相手を倒すことに成功した。
- 参考スコア(独自算出の注目度): 18.971623378904503
- License:
- Abstract: Significant progress has been made in AI for games, including board games, MOBA, and RTS games. However, complex agents are typically developed in an embedded manner, directly accessing game state information, unlike human players who rely on noisy visual data, leading to unfair competition. Developing complex non-embedded agents remains challenging, especially in card-based RTS games with complex features and large state spaces. We propose a non-embedded offline reinforcement learning training strategy using visual inputs to achieve real-time autonomous gameplay in the RTS game Clash Royale. Due to the lack of a object detection dataset for this game, we designed an efficient generative object detection dataset for training. We extract features using state-of-the-art object detection and optical character recognition models. Our method enables real-time image acquisition, perception feature fusion, decision-making, and control on mobile devices, successfully defeating built-in AI opponents. All code is open-sourced at https://github.com/wty-yy/katacr.
- Abstract(参考訳): ボードゲーム、MOBA、RTSゲームなど、ゲーム用のAIにおいて、大きな進歩があった。
しかし、複雑なエージェントは通常、ゲーム状態の情報に直接アクセスする組み込み方式で開発され、ノイズの多い視覚データに依存する人間のプレイヤーとは違い、不公平な競争に繋がる。
複雑な非埋め込みエージェントの開発は、特に複雑な特徴と大きな状態空間を持つカードベースのRTSゲームにおいて、依然として困難である。
RTSゲームClash Royaleにおいて,視覚入力を用いた非埋め込み型オフライン強化学習学習戦略を提案し,リアルタイムな自律型ゲームプレイを実現する。
このゲームにはオブジェクト検出データセットが欠如しているため、トレーニングのための効率的な生成オブジェクト検出データセットを設計した。
我々は、最先端のオブジェクト検出と光学的文字認識モデルを用いて特徴を抽出する。
提案手法により,リアルタイム画像取得,認識機能融合,意思決定,モバイルデバイスの制御が可能となり,組込みAI相手を打ち負かすことに成功した。
すべてのコードはhttps://github.com/wty-yy/katacr.comで公開されている。
関連論文リスト
- Human-like Bots for Tactical Shooters Using Compute-Efficient Sensors [13.743654443419384]
本稿では、複雑な商用標準の2v2戦術シューティングゲームで遊ぶために、模倣学習を用いてニューラルネットワークを訓練するための新しい手法を提案する。
提案手法は, 空間情報を効率よく取得する小型のレイキャストセンサを用いて, 画期的, 画期的, 画期的, 画期的な知覚アーキテクチャを利用する。
人間の評価テストは、AIエージェントが人間のようなゲームプレイ体験を提供しながら、計算制約下で効率的に操作できることを確認します。
論文 参考訳(メタデータ) (2024-12-30T12:06:37Z) - Instruction-Driven Game Engine: A Poker Case Study [53.689520884467065]
IDGEプロジェクトは、大規模言語モデルで自由形式のゲーム記述を追従し、ゲームプレイプロセスを生成することにより、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオへの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
我々の最初の進歩はポーカーのIDGEの開発であり、これは幅広いポーカーの変種をサポートするだけでなく、自然言語入力を通じて高度に個別化された新しいポーカーゲームを可能にする。
論文 参考訳(メタデータ) (2024-10-17T11:16:27Z) - Reinforcement Learning for High-Level Strategic Control in Tower Defense Games [47.618236610219554]
戦略ゲームにおいて、ゲームデザインの最も重要な側面の1つは、プレイヤーにとっての挑戦の感覚を維持することである。
従来のスクリプティング手法と強化学習を組み合わせた自動手法を提案する。
その結果、強化学習のような学習アプローチとスクリプトAIを組み合わせることで、AIのみを使用するよりも高性能で堅牢なエージェントが生まれることが示された。
論文 参考訳(メタデータ) (2024-06-12T08:06:31Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - CCPT: Automatic Gameplay Testing and Validation with
Curiosity-Conditioned Proximal Trajectories [65.35714948506032]
Curiosity-Conditioned Proximal Trajectories (CCPT)法は、好奇心と模倣学習を組み合わせてエージェントを訓練して探索する。
CCPTが複雑な環境を探索し、ゲームプレイの問題を発見し、その過程におけるデザインの監視を行い、それらをゲームデザイナーに直接認識し、強調する方法について説明する。
論文 参考訳(メタデータ) (2022-02-21T09:08:33Z) - On games and simulators as a platform for development of artificial
intelligence for command and control [46.33784995107226]
ゲームやシミュレータは、複雑なマルチエージェント、マルチプレイヤー、不完全な情報シナリオを実行する上で価値のあるプラットフォームである。
StarCraft IIのようなリアルタイム戦略ゲームにおける人工知能アルゴリズムの成功もまた、軍事研究コミュニティの注目を集めている。
論文 参考訳(メタデータ) (2021-10-21T17:39:58Z) - Applying supervised and reinforcement learning methods to create
neural-network-based agents for playing StarCraft II [0.0]
本稿では,汎用的な教師付き強化学習でトレーニングしたStarCraft IIのフル2プレーヤマッチングを実現するニューラルネットワークアーキテクチャを提案する。
本実装では,ゲーム内スクリプトボットと比較して,非自明な性能を実現している。
論文 参考訳(メタデータ) (2021-09-26T20:08:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。