論文の概要: Multi-Player Games with LDL Goals over Finite Traces
- arxiv url: http://arxiv.org/abs/2008.05647v1
- Date: Thu, 13 Aug 2020 02:11:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:58:30.337440
- Title: Multi-Player Games with LDL Goals over Finite Traces
- Title(参考訳): 有限トレース上のLDLゴールを用いたマルチプレイヤーゲーム
- Authors: Julian Gutierrez and Giuseppe Perelli and Michael Wooldridge
- Abstract要約: 有限トレース上の線形動的論理 LDLf は並列およびマルチエージェント系を推論するための強力な論理である。
LDLfを用いて,目標/目的を表現したマルチプレイヤーゲームにおける平衡特性のキャラクタリゼーションと検証を行う手法について検討する。
- 参考スコア(独自算出の注目度): 5.0082351824883045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linear Dynamic Logic on finite traces LDLf is a powerful logic for reasoning
about the behaviour of concurrent and multi-agent systems.
In this paper, we investigate techniques for both the characterisation and
verification of equilibria in multi-player games with goals/objectives
expressed using logics based on LDLf. This study builds upon a generalisation
of Boolean games, a logic-based game model of multi-agent systems where players
have goals succinctly represented in a logical way.
Because LDLf goals are considered, in the settings we study -- Reactive
Modules games and iterated Boolean games with goals over finite traces --
players' goals can be defined to be regular properties while achieved in a
finite, but arbitrarily large, trace.
In particular, using alternating automata, the paper investigates
automata-theoretic approaches to the characterisation and verification of (pure
strategy Nash) equilibria, shows that the set of Nash equilibria in
multi-player games with LDLf objectives is regular, and provides complexity
results for the associated automata constructions.
- Abstract(参考訳): 有限トレース上の線形動的論理 LDLf は並列およびマルチエージェントシステムの挙動を推論するための強力な論理である。
本稿では, LDLfに基づく論理式を用いて, 目的・目的を表現したマルチプレイヤーゲームにおいて, 平衡性の特徴付けと検証を行う手法について検討する。
この研究は、プレイヤーが論理的に簡潔に表現されたゴールを持つマルチエージェントシステムの論理ベースのゲームモデルであるブールゲーム(Boolean game)の一般化に基づいている。
LDLfのゴールは考慮されているので、我々が研究する設定では -- リアクティブモジュールゲームと有限トレース上のゴールを持つ反復ブーリアンゲーム - プレイヤーのゴールは有限だが任意に大きいトレースで達成しながら正規プロパティとして定義することができる。
特に、交代オートマトンを用いて、(純粋な戦略ナッシュ)平衡のキャラクタリゼーションと検証に対するオートマトン理論的アプローチを調査し、LDLf目標を持つマルチプレイヤーゲームにおけるナッシュ平衡のセットが正規であることを示し、関連するオートマトン構成の複雑性結果を提供する。
関連論文リスト
- Beyond Outcomes: Transparent Assessment of LLM Reasoning in Games [54.49589494014147]
GAMEBoTは、大規模言語モデルの厳格な評価のために設計されたゲームアリーナである。
我々は,8つのゲームにまたがる17の卓越したLSMをベンチマークし,様々な戦略能力とゲーム特性について検討した。
以上の結果から,LDMに詳細なCoTプロンプトが付与されている場合でも,GAMEBoTは大きな課題となることが示唆された。
論文 参考訳(メタデータ) (2024-12-18T08:32:53Z) - LogicGame: Benchmarking Rule-Based Reasoning Abilities of Large Language Models [87.49676980090555]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示し、複雑な問題解決能力を示している。
LLMの包括的なルール理解、実行、計画能力を評価するために設計された新しいベンチマークであるLogicGameを紹介する。
論文 参考訳(メタデータ) (2024-08-28T13:16:41Z) - Large Language Models Playing Mixed Strategy Nash Equilibrium Games [1.060608983034705]
本稿では,混合戦略のナッシュ均衡と純粋戦略のナッシュ均衡が存在しないゲームにおいて,ナッシュ均衡を求めるための大規模言語モデルの能力に焦点を当てる。
この研究は、コード実行の可能性を備えたLLMの性能が大幅に向上していることを明らかにする。
LLMは、よく知られた標準ゲームにおいて顕著な熟練度を示すが、その性能は、同じゲームのわずかな変更に直面した時に低下する。
論文 参考訳(メタデータ) (2024-06-15T09:30:20Z) - GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations [87.99872683336395]
大規模言語モデル(LLM)は、重要な現実世界のアプリケーションに統合される。
本稿では,LLMの競合環境における推論能力について検討する。
まず,広く認識されている10のタスクを構成する言語駆動型環境であるGTBenchを提案する。
論文 参考訳(メタデータ) (2024-02-19T18:23:36Z) - Exploring Self-supervised Logic-enhanced Training for Large Language Models [59.227222647741094]
本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。
我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。
2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文 参考訳(メタデータ) (2023-05-23T06:13:10Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - Equilibria for Games with Combined Qualitative and Quantitative
Objectives [15.590197778287616]
我々は,各プレイヤーが独立して戦略的に行動することが想定されるプロセスである並行ゲームについて研究する。
我々の主な結果は、そのようなゲームにおける厳密なエプシロン・ナッシュ均衡の存在を決定することは2ExpTime完全であるということである。
論文 参考訳(メタデータ) (2020-08-13T01:56:24Z) - Automated Temporal Equilibrium Analysis: Verification and Synthesis of
Multi-Player Games [5.230352342979224]
マルチエージェントシステムにおいて、合理的な検証問題は、システム内でどの時相論理特性が保持されるかをチェックすることである。
パリティゲームの集合の解に有理検証問題を還元する手法を提案する。
論文 参考訳(メタデータ) (2020-08-13T01:43:31Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。