論文の概要: Exploring Decision-Making Capabilities of LLM Agents: An Experimental Study on Jump-Jump Game
- arxiv url: http://arxiv.org/abs/2509.00483v1
- Date: Sat, 30 Aug 2025 12:50:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.253692
- Title: Exploring Decision-Making Capabilities of LLM Agents: An Experimental Study on Jump-Jump Game
- Title(参考訳): LLMエージェントの意思決定能力を探る:ジャンプジャンプゲームの実験的検討
- Authors: Juwu Li,
- Abstract要約: プレイヤーは現在の位置とターゲットプラットフォーム距離に基づいてジャンプ力を正確に制御する必要がある。
これはJump-Jumpゲームの基本的なゲームプレイの仕組みを描いており、プレイヤーキャラクターはスコアを最大化するために適切な力でプラットフォームを飛び越えなければならない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Jump-Jump game, as a simple yet challenging casual game, provides an ideal testing environment for studying LLM decision-making capabilities. The game requires players to precisely control jumping force based on current position and target platform distance, involving multiple cognitive aspects including spatial reasoning, physical modeling, and strategic planning. It illustrates the basic gameplay mechanics of the Jump-Jump game, where the player character (red circle) must jump across platforms with appropriate force to maximize score.
- Abstract(参考訳): Jump-Jumpゲームは、単純だが挑戦的なカジュアルゲームであり、LLM意思決定能力を研究する上で理想的なテスト環境を提供する。
このゲームでは、プレイヤーは現在の位置とターゲットプラットフォーム距離に基づいてジャンプ力を正確に制御し、空間的推論、物理的モデリング、戦略的計画を含む複数の認知的側面を含む必要がある。
ジャンプ・ジャンプゲームの基本的なゲームプレイの仕組みを描いており、プレイヤーキャラクター(赤い円)はスコアを最大化するために適切な力でプラットフォームを飛び越えなければならない。
関連論文リスト
- Game-TARS: Pretrained Foundation Models for Scalable Generalist Multimodal Game Agents [56.25101378553328]
本稿では,汎用ゲームエージェントであるGame-TARSについて紹介する。
Game-TARSは500B以上のトークンで事前トレーニングされており、様々な軌跡とマルチモーダルデータがある。
実験により、Game-TARSは、オープンワールドMinecraftタスクにおける以前のソータモデルの約2倍の成功率を達成することが示された。
論文 参考訳(メタデータ) (2025-10-27T17:43:51Z) - Leveraging LLM Agents for Automated Video Game Testing [27.85022072249338]
Tests MMORPGs(Massively Multiplayer Online Role-Playing Games)は、ゲーム開発において重要な作業である。
これらの課題に対処するため,知的MMORPGテストのための効果的なLLM駆動エージェントフレームワークであるTITANを提案する。
我々はTITANのプロトタイプを実装し、PCとモバイルプラットフォームにまたがる2つの大規模商用MMORPG上で評価する。
論文 参考訳(メタデータ) (2025-09-26T10:31:21Z) - Orak: A Foundational Benchmark for Training and Evaluating LLM Agents on Diverse Video Games [29.194229891848853]
Orakは、さまざまな現実世界のビデオゲームでLarge Language Model (LLM)エージェントをトレーニングし、評価するために設計されたベンチマークである。
LLMの一貫した評価を支援するために,モデルコンテキストプロトコル(MCP)に基づくプラグアンドプレイインタフェースを導入する。
Orakは総合的な評価フレームワークを提供しており、一般的なゲームスコアのリーダーボード、LLMバトルアリーナ、視覚入力状態、エージェント戦略、微調整効果の詳細な分析を含んでいる。
論文 参考訳(メタデータ) (2025-06-04T06:40:33Z) - Reinforcement Learning for High-Level Strategic Control in Tower Defense Games [47.618236610219554]
戦略ゲームにおいて、ゲームデザインの最も重要な側面の1つは、プレイヤーにとっての挑戦の感覚を維持することである。
従来のスクリプティング手法と強化学習を組み合わせた自動手法を提案する。
その結果、強化学習のような学習アプローチとスクリプトAIを組み合わせることで、AIのみを使用するよりも高性能で堅牢なエージェントが生まれることが示された。
論文 参考訳(メタデータ) (2024-06-12T08:06:31Z) - SmartPlay: A Benchmark for LLMs as Intelligent Agents [45.76707302899935]
SmartPlayはRock-Paper-Scissors, Tower of Hanoi, Minecraftなど,6つの異なるゲームで構成されている。
各ゲームは知的LLMエージェントの9つの重要な能力のサブセットに挑戦する。
テストには、オブジェクト依存による推論、事前計画、空間的推論、履歴からの学習、ランダムさの理解が含まれる。
論文 参考訳(メタデータ) (2023-10-02T18:52:11Z) - Continuous Versatile Jumping Using Learned Action Residuals [35.996425893483796]
本研究では,四足歩行ロボットの連続的な跳躍動作を学習するために,最適制御と強化学習を組み合わせた階層的枠組みを提案する。
我々のフレームワークの中核はスタンスコントローラであり、手動で設計した加速度コントローラと学習された残留ポリシーを組み合わせる。
シミュレーションのトレーニングの後、我々のフレームワークは実際のロボットに直接展開でき、多目的で連続的なジャンプ動作を行うことができる。
論文 参考訳(メタデータ) (2023-04-17T23:28:32Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game
Environment for Multi-agent Reinforcement Learning [38.4742699455284]
バスケットボールの試合をエージェントが訓練する新しい強化学習環境であるFever Basketballゲームを紹介した。
複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。
現実のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballは新しい非同期環境となる。
論文 参考訳(メタデータ) (2020-12-06T07:51:59Z) - DeepCrawl: Deep Reinforcement Learning for Turn-based Strategy Games [137.86426963572214]
Deep CrawlはiOSとAndroid用の完全にプレイ可能なRogueライクなプロトタイプで、すべてのエージェントがDeep Reinforcement Learning (DRL)を使用してトレーニングされたポリシーネットワークによって制御される。
本研究の目的は、近年のDRLの進歩が、ビデオゲームにおける非プレイヤーキャラクターに対する説得力のある行動モデルの開発に有効であるかどうかを理解することである。
論文 参考訳(メタデータ) (2020-12-03T13:53:29Z) - Neural MMO v1.3: A Massively Multiagent Game Environment for Training
and Evaluating Neural Networks [48.5733173329785]
本稿では,MMOにインスパイアされたマルチエージェントゲーム環境であるNeural MMOを紹介する。
分散インフラストラクチャとゲームIOという,AI研究のためのマルチエージェントシステムエンジニアリングにおける,より一般的な2つの課題について論じる。
論文 参考訳(メタデータ) (2020-01-31T18:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。