論文の概要: Multi-Player Games with LDL Goals over Finite Traces
- arxiv url: http://arxiv.org/abs/2008.05647v1
- Date: Thu, 13 Aug 2020 02:11:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:58:30.337440
- Title: Multi-Player Games with LDL Goals over Finite Traces
- Title(参考訳): 有限トレース上のLDLゴールを用いたマルチプレイヤーゲーム
- Authors: Julian Gutierrez and Giuseppe Perelli and Michael Wooldridge
- Abstract要約: 有限トレース上の線形動的論理 LDLf は並列およびマルチエージェント系を推論するための強力な論理である。
LDLfを用いて,目標/目的を表現したマルチプレイヤーゲームにおける平衡特性のキャラクタリゼーションと検証を行う手法について検討する。
- 参考スコア(独自算出の注目度): 5.0082351824883045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linear Dynamic Logic on finite traces LDLf is a powerful logic for reasoning
about the behaviour of concurrent and multi-agent systems.
In this paper, we investigate techniques for both the characterisation and
verification of equilibria in multi-player games with goals/objectives
expressed using logics based on LDLf. This study builds upon a generalisation
of Boolean games, a logic-based game model of multi-agent systems where players
have goals succinctly represented in a logical way.
Because LDLf goals are considered, in the settings we study -- Reactive
Modules games and iterated Boolean games with goals over finite traces --
players' goals can be defined to be regular properties while achieved in a
finite, but arbitrarily large, trace.
In particular, using alternating automata, the paper investigates
automata-theoretic approaches to the characterisation and verification of (pure
strategy Nash) equilibria, shows that the set of Nash equilibria in
multi-player games with LDLf objectives is regular, and provides complexity
results for the associated automata constructions.
- Abstract(参考訳): 有限トレース上の線形動的論理 LDLf は並列およびマルチエージェントシステムの挙動を推論するための強力な論理である。
本稿では, LDLfに基づく論理式を用いて, 目的・目的を表現したマルチプレイヤーゲームにおいて, 平衡性の特徴付けと検証を行う手法について検討する。
この研究は、プレイヤーが論理的に簡潔に表現されたゴールを持つマルチエージェントシステムの論理ベースのゲームモデルであるブールゲーム(Boolean game)の一般化に基づいている。
LDLfのゴールは考慮されているので、我々が研究する設定では -- リアクティブモジュールゲームと有限トレース上のゴールを持つ反復ブーリアンゲーム - プレイヤーのゴールは有限だが任意に大きいトレースで達成しながら正規プロパティとして定義することができる。
特に、交代オートマトンを用いて、(純粋な戦略ナッシュ)平衡のキャラクタリゼーションと検証に対するオートマトン理論的アプローチを調査し、LDLf目標を持つマルチプレイヤーゲームにおけるナッシュ平衡のセットが正規であることを示し、関連するオートマトン構成の複雑性結果を提供する。
関連論文リスト
- GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via
Game-Theoretic Evaluations [91.30799663654965]
本稿では,ボードゲームやカードゲームなどのゲーム理論タスクを通じて,競争環境における大規模言語モデルの推論能力を評価する。
GTBenchは、広く認識されている10のタスクを包括的ゲーム分類によって構成する言語駆動型環境である。
論文 参考訳(メタデータ) (2024-02-19T18:23:36Z) - Can LLMs Reason with Rules? Logic Scaffolding for Stress-Testing and
Improving LLMs [95.41575344721691]
大規模言語モデル(LLM)は、様々な推論タスクにおいて、印象的な人間的なパフォーマンスを実現している。
しかし、その根底にある推論規則の熟達性は、人間の能力に欠ける。
本稿では,推論ルールベースであるULogicを構築するための,推論ルール生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-18T03:38:51Z) - Learning To Teach Large Language Models Logical Reasoning [33.88499005859982]
大規模言語モデル(LLM)は、学術と産業の両方から大きな注目を集めている。
しかし、現在のLLMは、その固有の問題のために、実用的な推論タスクにおいて信頼性の低いコンテンツを出力している。
論文 参考訳(メタデータ) (2023-10-13T14:53:06Z) - Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical
Reasoning Capabilities of Language Models [58.76688462256284]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。
一つのタスクトレーニング,複数タスクトレーニング,および思考知識の蒸留微調整手法の連鎖について検討し,異なる論理的推論カテゴリにおけるモデルの性能を評価する。
論文 参考訳(メタデータ) (2023-10-02T01:00:50Z) - Exploring Self-supervised Logic-enhanced Training for Large Language Models [59.227222647741094]
本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。
我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。
2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文 参考訳(メタデータ) (2023-05-23T06:13:10Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - Equilibrium Design for Concurrent Games [5.9873770241999]
ゲーム理論において、メカニズム設計は、ゲームの望ましい結果を達成するためのインセンティブの設計に関係している。
インセンティブの設計について検討し、例えば、所与の時間論理的性質を満たす平衡を求める。
応用として、平衡設計は、並列ゲームに対する合理的な合成と検証問題の代替解として用いられる。
論文 参考訳(メタデータ) (2021-06-18T15:45:45Z) - Equilibria for Games with Combined Qualitative and Quantitative
Objectives [15.590197778287616]
我々は,各プレイヤーが独立して戦略的に行動することが想定されるプロセスである並行ゲームについて研究する。
我々の主な結果は、そのようなゲームにおける厳密なエプシロン・ナッシュ均衡の存在を決定することは2ExpTime完全であるということである。
論文 参考訳(メタデータ) (2020-08-13T01:56:24Z) - Automated Temporal Equilibrium Analysis: Verification and Synthesis of
Multi-Player Games [5.230352342979224]
マルチエージェントシステムにおいて、合理的な検証問題は、システム内でどの時相論理特性が保持されるかをチェックすることである。
パリティゲームの集合の解に有理検証問題を還元する手法を提案する。
論文 参考訳(メタデータ) (2020-08-13T01:43:31Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。