論文の概要: Can LLMs Play Ô Ăn Quan Game? A Study of Multi-Step Planning and Decision Making
- arxiv url: http://arxiv.org/abs/2507.03711v3
- Date: Wed, 09 Jul 2025 02:09:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 13:22:10.056293
- Title: Can LLMs Play Ô Ăn Quan Game? A Study of Multi-Step Planning and Decision Making
- Title(参考訳): LLMはクァンゲームでもできるのか? マルチステップ計画と意思決定に関する研究
- Authors: Sang Quang Nguyen, Kiet Van Nguyen, Vinh-Tiep Nguyen, Thanh Duc Ngo, Ngan Luu-Thuy Nguyen, Duy-Dinh Le,
- Abstract要約: 我々は,ベトナムのボードゲーム「O uAn Quan」のレンズを通して,大規模言語モデル(LLM)を計画し,意思決定する能力について検討する。
具体的には,攻撃的から防御的まで多岐にわたるエージェントペルソナを開発し,O uAn Quan ゲームを様々な戦略で LLM 性能を評価するテストベッドとして利用する。
- 参考スコア(独自算出の注目度): 3.827471128756051
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we explore the ability of large language models (LLMs) to plan and make decisions through the lens of the traditional Vietnamese board game, \^O \u{A}n Quan. This game, which involves a series of strategic token movements and captures, offers a unique environment for evaluating the decision-making and strategic capabilities of LLMs. Specifically, we develop various agent personas, ranging from aggressive to defensive, and employ the \^O \u{A}n Quan game as a testbed for assessing LLM performance across different strategies. Through experimentation with models like Llama-3.2-3B-Instruct, Llama-3.1-8B-Instruct, and Llama-3.3-70B-Instruct, we aim to understand how these models execute strategic decision-making, plan moves, and manage dynamic game states. The results will offer insights into the strengths and weaknesses of LLMs in terms of reasoning and strategy, contributing to a deeper understanding of their general capabilities.
- Abstract(参考訳): 本稿では,ベトナムの伝統的なボードゲームである \^O \u{A}n Quan のレンズを用いて,大規模言語モデル(LLM)の計画と意思決定能力について検討する。
一連の戦略的トークンの動きとキャプチャを含むこのゲームは、LSMの意思決定と戦略能力を評価するためのユニークな環境を提供する。
具体的には、攻撃的から防御的まで多様なエージェントペルソナを開発し、異なる戦略間でLLM性能を評価するテストベッドとして \^O \u{A}n Quan ゲームを利用する。
Llama-3.2-3B-インストラクト、Llama-3.1-8B-インストラクト、Llama-3.3-70B-インストラクトといったモデルを用いた実験により、これらのモデルがどのように戦略的意思決定を行い、計画し、動的ゲーム状態を管理するかを理解することを目指している。
結果は、LLMの長所と短所を推論と戦略の観点から把握し、それらの一般的な能力のより深い理解に寄与する。
関連論文リスト
- LLM-Gomoku: A Large Language Model-Based System for Strategic Gomoku with Self-Play and Reinforcement Learning [4.22453895366234]
本研究では,大規模言語モデル(LLM)に基づく五目AIシステムの開発を目的とする。
五目成層論や論理を理解・適用し、合理的な決定を下すよう設計されている。
広範囲な自己演奏訓練を経て、モデルの五目演奏能力は顕著に強化された。
論文 参考訳(メタデータ) (2025-03-27T16:52:25Z) - Strategist: Learning Strategic Skills by LLMs via Bi-Level Tree Search [32.657454056329875]
LLMを利用したマルチエージェントゲームのための新しいスキル獲得手法STRATEGISTを提案する。
本手法はモンテカルロ木探索による自己再生シミュレーションにより品質フィードバックを収集する。
ゲームにおけるアクションプランニングと対話生成の両面において,我々の手法をどのように利用できるかを紹介する。
論文 参考訳(メタデータ) (2024-08-20T08:22:04Z) - GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations [87.99872683336395]
大規模言語モデル(LLM)は、重要な現実世界のアプリケーションに統合される。
本稿では,LLMの競合環境における推論能力について検討する。
まず,広く認識されている10のタスクを構成する言語駆動型環境であるGTBenchを提案する。
論文 参考訳(メタデータ) (2024-02-19T18:23:36Z) - K-Level Reasoning: Establishing Higher Order Beliefs in Large Language Models for Strategic Reasoning [76.3114831562989]
マルチエージェント環境で戦略を動的に適応させるためには、LLM(Large Language Model)エージェントが必要である。
我々は,「K-Level Reasoning with Large Language Models (K-R)」という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-02T16:07:05Z) - ALYMPICS: LLM Agents Meet Game Theory -- Exploring Strategic
Decision-Making with AI Agents [77.34720446306419]
Alympicsは、ゲーム理論の研究にLarge Language Model (LLM)エージェントを利用する、体系的なシミュレーションフレームワークである。
Alympicsは、複雑なゲーム理論の問題を研究するための汎用的なプラットフォームを作成する。
論文 参考訳(メタデータ) (2023-11-06T16:03:46Z) - Leveraging Word Guessing Games to Assess the Intelligence of Large
Language Models [105.39236338147715]
この論文は人気のある言語ゲーム『Who is Spy』にインスパイアされている。
本研究は,LEMの表現と変形能力を評価するためのDEEPを開発する。
次に、インタラクティブなマルチエージェントフレームワークであるSpyGameを紹介します。
論文 参考訳(メタデータ) (2023-10-31T14:37:42Z) - Strategic Reasoning with Language Models [35.63300060111918]
戦略的推論は、エージェントが様々な状況において他のエージェントと協力し、コミュニケーションし、競合することを可能にする。
既存の戦略ゲームに対するアプローチは、広範なトレーニングに依存しており、再訓練なしに新しいシナリオやゲームに一般化しない戦略を生み出している。
本稿では,AIエージェントの戦略的推論を可能にするために,事前訓練された大規模言語モデルと数発の連鎖例を用いたアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-30T16:09:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。