論文の概要: Multi-Agent Strategic Games with LLMs
- arxiv url: http://arxiv.org/abs/2605.03604v1
- Date: Tue, 05 May 2026 10:28:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.892165
- Title: Multi-Agent Strategic Games with LLMs
- Title(参考訳): LLMを用いたマルチエージェント戦略ゲーム
- Authors: Maxim Chupilkin,
- Abstract要約: 本稿では,大規模言語モデル (LLM) が紛争と協力の戦略的基盤の研究に有効かどうかを問う。
繰り返しセキュリティジレンマにおいて,LLMを実験対象として紹介し,国際関係論から標準メカニズムを再現するかどうかを評価する。
複数のモデルにまたがって、結果は体系的かつ一貫したパターンを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper asks whether large language models (LLMs) can be used to study the strategic foundations of conflict and cooperation. I introduce LLMs as experimental subjects in a repeated security dilemma and evaluate whether they reproduce canonical mechanisms from international relations theory. The baseline game is extended along three theoretically central dimensions: multipolarity, finite time horizons, and the availability of communication. Across multiple models, the results exhibit systematic and consistent patterns: multipolarity increases the likelihood of conflict, finite horizons induce universal unraveling consistent with backward-induction logic, and communication reduces conflict by enabling signaling and reciprocity. Beyond observed behavior, the design provides access to agents' private reasoning and public messages, allowing choices to be linked to underlying strategic logics such as preemption, cooperation under uncertainty, and trust-building. The contribution is primarily methodological. LLM-based experiments offer a scalable, transparent, and replicable approach to probing theoretical mechanisms.
- Abstract(参考訳): 本稿では,大規模言語モデル (LLM) が紛争と協力の戦略的基盤の研究に有効かどうかを問う。
繰り返しセキュリティジレンマにおいて,LLMを実験対象として紹介し,国際関係論から標準メカニズムを再現するかどうかを評価する。
ベースラインゲームは、多極性、有限時間地平線、通信の可用性という、理論上中心的な3つの次元に沿って拡張される。
多重極性は衝突の可能性を増大させ、有限地平線は後方誘導論理に整合した普遍的解法を誘導し、通信は信号化と相互性を可能にすることで競合を減少させる。
観察された行動以外にも、このデザインはエージェントのプライベートな推論や公開メッセージへのアクセスを提供し、プリエンプション、不確実性の下での協力、信頼構築といった基本的な戦略論理に選択を関連付けることができる。
その貢献は主に方法論的だ。
LLMに基づく実験は、理論的なメカニズムを探索するスケーラブルで透明で複製可能なアプローチを提供する。
関連論文リスト
- Diagnosing Knowledge Conflict in Multimodal Long-Chain Reasoning [78.86309644343295]
長い連鎖推論におけるマルチモーダルな大言語モデル(MLLM)は、異なる知識源が矛盾する信号を提供するときにしばしば失敗する。
我々は、これらの失敗を知識の衝突という統一概念の下で形式化し、入力レベルの客観的衝突とプロセスレベルの効果的な衝突を区別する。
本研究は,知識衝突下でのマルチモーダル推論のメカニズムを考察し,長CoT障害の診断と制御を可能にする。
論文 参考訳(メタデータ) (2026-02-16T07:10:44Z) - Understanding LLM Agent Behaviours via Game Theory: Strategy Recognition, Biases and Multi-Agent Dynamics [1.6487772637295166]
我々はFAIRGAMEフレームワークを拡張し、繰り返しの社会的ジレンマにおける大規模言語モデル(LLM)の振る舞いを評価する。
LLMは、言語フレーミングが建築的差異に匹敵する効果を発揮することを示し、体系的、モデル的、言語に依存した行動意図を示す。
論文 参考訳(メタデータ) (2025-12-08T11:40:03Z) - Multi-Path Collaborative Reasoning via Reinforcement Learning [54.8518809800168]
CoT(Chain-of-Thought)推論は、LLM(Large Language Models)の問題解決能力を大幅に向上させた。
最近の手法では、連続的な意味空間における推論を可能にするために、ソフトな抽象トークンを生成することでこの問題に対処しようとしている。
提案するM3PO(Multi-Path Perception Policy Optimization)は,推論プロセスに集団的洞察を明示的に注入する,新たな強化学習フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T10:05:46Z) - Thinker: Training LLMs in Hierarchical Thinking for Deep Search via Multi-Turn Interaction [57.67217258741752]
Thinkerはマルチターンインタラクションによるディープ検索のための階層的思考モデルである。
複素問題を独立に解ける部分確率に分解する。
サブプロブレム間の依存関係は、これらの論理関数を介してパラメータとして渡される。
論文 参考訳(メタデータ) (2025-11-11T07:48:45Z) - DocThinker: Explainable Multimodal Large Language Models with Rule-based Reinforcement Learning for Document Understanding [66.07724324530844]
動的推論時間推論のためのルールベースの強化学習フレームワークであるDocThinkerを提案する。
本手法は破滅的な忘れ込みを軽減し,適応性と透明性を両立させる。
本研究は,MLLMに基づく文書理解における説明可能性と適応性を高めるための強力な代替手段として,RLに注目した。
論文 参考訳(メタデータ) (2025-08-12T03:06:55Z) - A Trustworthy Multi-LLM Network: Challenges,Solutions, and A Use Case [59.58213261128626]
複数の大規模言語モデル(LLM)を信頼性のあるマルチLLMネットワーク(MultiLLMN)に接続するブロックチェーン対応協調フレームワークを提案する。
このアーキテクチャは、複雑なネットワーク最適化問題に対する最も信頼性が高く高品質な応答の協調評価と選択を可能にする。
論文 参考訳(メタデータ) (2025-05-06T05:32:46Z) - SIGMA: Sheaf-Informed Geometric Multi-Agent Pathfinding [11.38008343729117]
多エージェントパス探索問題は、大規模物流および輸送におけるロボット展開における中核的な課題である。
分散化深層学習にせん断理論を適用した新しい枠組みを導入する。
提案手法は、最先端の学習ベースMAPFプランナよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2025-02-10T13:17:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。