論文の概要: Evaluating LLMs in Open-Source Games
- arxiv url: http://arxiv.org/abs/2512.00371v1
- Date: Sat, 29 Nov 2025 07:46:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.202019
- Title: Evaluating LLMs in Open-Source Games
- Title(参考訳): オープンソースゲームにおけるLLMの評価
- Authors: Swadesh Sistla, Max Kleiman-Weiner,
- Abstract要約: LLM(Large Language Models)プログラミング能力は、オープンソースゲームへの参加を可能にする。
プログラム戦略を予測・分類するために,オープンおよびクローズドウェイト LLM をリードする能力を評価する。
我々は,これらのプログラムにおけるメカニズムの適応を,繰り返しのオープンソースゲームに対して特徴付けるために,ペイオフ最大化,協調的,詐欺的戦略の出現を同定する。
- 参考スコア(独自算出の注目度): 4.402529312804103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models' (LLMs) programming capabilities enable their participation in open-source games: a game-theoretic setting in which players submit computer programs in lieu of actions. These programs offer numerous advantages, including interpretability, inter-agent transparency, and formal verifiability; additionally, they enable program equilibria, solutions that leverage the transparency of code and are inaccessible within normal-form settings. We evaluate the capabilities of leading open- and closed-weight LLMs to predict and classify program strategies and evaluate features of the approximate program equilibria reached by LLM agents in dyadic and evolutionary settings. We identify the emergence of payoff-maximizing, cooperative, and deceptive strategies, characterize the adaptation of mechanisms within these programs over repeated open-source games, and analyze their comparative evolutionary fitness. We find that open-source games serve as a viable environment to study and steer the emergence of cooperative strategy in multi-agent dilemmas.
- Abstract(参考訳): LLM(Large Language Models)プログラミング能力は、プレイヤーがアクションの代わりにコンピュータプログラムを提出するゲーム理論の、オープンソースゲームへの参加を可能にする。
これらのプログラムには、解釈可能性、エージェント間の透明性、形式的検証性など、数多くの利点がある。
オープン・アンド・クローズド・ウェイト LLM のプログラム戦略を予測・分類し, LLM エージェントが到達した近似プログラム平衡の特徴を, 動的・進化的設定で評価する能力について検討した。
我々は、ペイオフ最大化、協調的、詐欺的戦略の出現を識別し、反復的なオープンソースゲームに対するこれらのプログラム内のメカニズムの適応を特徴付けるとともに、それらの比較進化的適合度を解析する。
オープンソースゲームは,マルチエージェントジレンマにおける協調戦略の出現を研究する上で,有効な環境であることがわかった。
関連論文リスト
- On Integrating Large Language Models and Scenario-Based Programming for Improving Software Reliability [2.2058293096044586]
大規模言語モデル(LLM)は、ソフトウェア開発者にとって急速に欠かせないツールになりつつある。
LLMは、しばしば重大なエラーを導入し、説得力のある信頼を持って間違ったコードを提示する。
本研究では,LLMと従来のソフトウェア工学技術を組み合わせる手法を構造化された方法で提案する。
論文 参考訳(メタデータ) (2025-09-11T07:10:25Z) - Can LLMs effectively provide game-theoretic-based scenarios for cybersecurity? [51.96049148869987]
大規模言語モデル(LLM)は、コンピュータシステムのセキュリティに新しいツールと課題を提供する。
従来のゲーム理論フレームワークが,LLM駆動型アクターやボットの動作を効果的に捉えることができるかどうかを検討する。
論文 参考訳(メタデータ) (2025-08-04T08:57:14Z) - Game-theoretic LLM: Agent Workflow for Negotiation Games [30.83905391503607]
本稿では,大規模言語モデル(LLM)の戦略的意思決定文脈における合理性について検討する。
LLMの推論と意思決定を導く複数のゲーム理論を設計する。
この発見は、より堅牢で戦略的に健全なAIエージェントの開発に影響を及ぼす。
論文 参考訳(メタデータ) (2024-11-08T22:02:22Z) - Evaluating and Enhancing LLMs Agent based on Theory of Mind in Guandan: A Multi-Player Cooperative Game under Imperfect Information [36.11862095329315]
大規模言語モデル(LLM)は、不完全な情報で単純なゲームを扱うことに成功している。
本研究では,オープンソースのLLMとAPIベースのLLMが獲得した知識を,洗練されたテキストベースのゲームに適用する可能性について検討する。
論文 参考訳(メタデータ) (2024-08-05T15:36:46Z) - Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents [101.17919953243107]
GovSimは、大規模言語モデル(LLM)における戦略的相互作用と協調的意思決定を研究するために設計された生成シミュレーションプラットフォームである。
最強のLSMエージェントを除く全てのエージェントは、GovSimの持続的均衡を達成することができず、生存率は54%以下である。
道徳的思考の理論である「大学化」に基づく推論を活用するエージェントは、持続可能性を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-04-25T15:59:16Z) - MAgIC: Investigation of Large Language Model Powered Multi-Agent in Cognition, Adaptability, Rationality and Collaboration [98.18244218156492]
大規模言語モデル(LLM)は、非常に高度な自然言語処理を持つ。
アプリケーションがマルチエージェント環境に拡大するにつれて、包括的な評価フレームワークの必要性が生じる。
この研究は、マルチエージェント設定内でLLMを評価するための新しい競合ベースのベンチマークフレームワークを導入している。
論文 参考訳(メタデータ) (2023-11-14T21:46:27Z) - ALYMPICS: LLM Agents Meet Game Theory -- Exploring Strategic
Decision-Making with AI Agents [77.34720446306419]
Alympicsは、ゲーム理論の研究にLarge Language Model (LLM)エージェントを利用する、体系的なシミュレーションフレームワークである。
Alympicsは、複雑なゲーム理論の問題を研究するための汎用的なプラットフォームを作成する。
論文 参考訳(メタデータ) (2023-11-06T16:03:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。