論文の概要: Automated Temporal Equilibrium Analysis: Verification and Synthesis of
Multi-Player Games
- arxiv url: http://arxiv.org/abs/2008.05638v1
- Date: Thu, 13 Aug 2020 01:43:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:59:13.290025
- Title: Automated Temporal Equilibrium Analysis: Verification and Synthesis of
Multi-Player Games
- Title(参考訳): 時間平衡の自動解析:マルチプレイヤーゲームの検証と合成
- Authors: Julian Gutierrez and Muhammad Najib and Giuseppe Perelli and Michael
Wooldridge
- Abstract要約: マルチエージェントシステムにおいて、合理的な検証問題は、システム内でどの時相論理特性が保持されるかをチェックすることである。
パリティゲームの集合の解に有理検証問題を還元する手法を提案する。
- 参考スコア(独自算出の注目度): 5.230352342979224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of multi-agent systems, the rational verification problem is
concerned with checking which temporal logic properties will hold in a system
when its constituent agents are assumed to behave rationally and strategically
in pursuit of individual objectives. Typically, those objectives are expressed
as temporal logic formulae which the relevant agent desires to see satisfied.
Unfortunately, rational verification is computationally complex, and requires
specialised techniques in order to obtain practically useable implementations.
In this paper, we present such a technique. This technique relies on a
reduction of the rational verification problem to the solution of a collection
of parity games. Our approach has been implemented in the Equilibrium
Verification Environment (EVE) system. The EVE system takes as input a model of
a concurrent/multi-agent system represented using the Simple Reactive Modules
Language (SRML), where agent goals are represented as Linear Temporal Logic
(LTL) formulae, together with a claim about the equilibrium behaviour of the
system, also expressed as an LTL formula. EVE can then check whether the LTL
claim holds on some (or every) computation of the system that could arise
through agents choosing Nash equilibrium strategies; it can also check whether
a system has a Nash equilibrium, and synthesise individual strategies for
players in the multi-player game. After presenting our basic framework, we
describe our new technique and prove its correctness. We then describe our
implementation in the EVE system, and present experimental results which show
that EVE performs favourably in comparison to other existing tools that support
rational verification.
- Abstract(参考訳): マルチエージェントシステムの文脈において、合理的な検証問題は、その構成エージェントが個々の目的を追求する際に合理的かつ戦略的に振る舞うと仮定した場合、システム内でどの時間論理特性が保持されるかを確認することである。
通常、これらの目的は、関連するエージェントが満足したいと思う時間論理式として表現される。
残念ながら、合理的な検証は計算が複雑であり、実用的な実装を得るためには特別な技術が必要である。
本稿では,そのような手法を提案する。
この手法は、合理性検証問題をパリティゲームの集合の解に還元することに依存している。
本手法はEVE(Equilibrium Verification Environment)システムで実装されている。
eveシステムは、単純なreactive modules language(srml)を用いて表現される並行/マルチエージェントシステムのモデルとして入力され、エージェントの目標を線形時相論理(ltl)式として表現し、システムの平衡挙動に関する主張とともに、ltl式としても表現される。
EVEは、LTLクレームがナッシュ均衡戦略を選択するエージェントによって生じる可能性のあるシステムのいくつかの(またはすべての)計算を保持できるかどうかを確認することができ、また、システムがナッシュ均衡を持つかどうかをチェックでき、マルチプレイヤーゲームにおけるプレイヤーの個別戦略を合成することができる。
基本的枠組みを提示した後、新しい手法を説明し、その正確性を証明する。
次に、EVEシステムにおける実装について述べ、EVEが有理検証をサポートする他の既存のツールと比較して好適に動作することを示す実験結果を示す。
関連論文リスト
- Responsibility-aware Strategic Reasoning in Probabilistic Multi-Agent Systems [1.7819574476785418]
責任は、信頼できる自律システムの開発と展開において重要な役割を果たす。
本稿では,確率的交代時間論理の変種であるPATL+Rを提案する。
本稿では,PATL+Rで指定された結果を満たす共同戦略の合成手法を提案する。
論文 参考訳(メタデータ) (2024-10-31T18:49:12Z) - Verified Compositional Neuro-Symbolic Control for Stochastic Systems
with Temporal Logic Tasks [11.614036749291216]
自律エージェントのためのニューラルネットワーク(NN)コントローラを学ぶために、最近いくつかの方法が提案されている。
これらのアプローチにおける重要な課題は、しばしば安全保証が欠如しているか、提供された保証が現実的でないことである。
本稿では,訓練されたNNコントローラの時間的構成が存在するかどうかを確認することで,この問題に対処することを目的とする。
論文 参考訳(メタデータ) (2023-11-17T20:51:24Z) - On the Complexity of Rational Verification [5.230352342979224]
合理的検証とは、同時マルチエージェントシステムの時間論理特性が保持する問題を指す。
合理的な検証の複雑さは仕様によって大幅に低減できることを示す。
平均支払ユーティリティ関数によって与えられるプレイヤーの目標を考慮した場合、合理的な検証のための改善された結果を提供する。
論文 参考訳(メタデータ) (2022-07-06T12:56:22Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Finding General Equilibria in Many-Agent Economic Simulations Using Deep
Reinforcement Learning [72.23843557783533]
本研究では,エージェント種別のメタゲームに対して,エプシロン・ナッシュ平衡である安定解を求めることができることを示す。
私たちのアプローチはより柔軟で、例えば市場クリア化のような非現実的な仮定は必要ありません。
当社のアプローチは、実際のビジネスサイクルモデル、DGEモデルの代表的なファミリー、100人の労働者消費者、10社の企業、税金と再分配を行う政府で実証しています。
論文 参考訳(メタデータ) (2022-01-03T17:00:17Z) - Automated Machine Learning, Bounded Rationality, and Rational
Metareasoning [62.997667081978825]
有界合理性の観点から、自動機械学習(AutoML)と関連する問題を考察する。
リソース境界の下でアクションを取るには、エージェントがこれらのリソースを最適な方法で利用する方法を反映する必要がある。
論文 参考訳(メタデータ) (2021-09-10T09:10:20Z) - Rational Verification for Probabilistic Systems [2.4254101826561847]
我々は確率的システムにおける合理的な検証の理論とアルゴリズムを開発する。
複雑なマルチエージェント環境における不確実性とランダム性をモデル化するための並列ゲーム(CSG)に焦点を当てる。
論文 参考訳(メタデータ) (2021-07-19T19:24:16Z) - Equilibrium Design for Concurrent Games [5.9873770241999]
ゲーム理論において、メカニズム設計は、ゲームの望ましい結果を達成するためのインセンティブの設計に関係している。
インセンティブの設計について検討し、例えば、所与の時間論理的性質を満たす平衡を求める。
応用として、平衡設計は、並列ゲームに対する合理的な合成と検証問題の代替解として用いられる。
論文 参考訳(メタデータ) (2021-06-18T15:45:45Z) - Online Learning Probabilistic Event Calculus Theories in Answer Set
Programming [70.06301658267125]
イベント認識(CER)システムは、事前に定義されたイベントパターンを使用して、ストリーミングタイムスタンプデータセットで発生を検出する。
本稿では,複雑なイベントパターンによる確率論的推論を,イベント計算で重み付けされたルールの形で行うことができるAnswer Set Programming(ASP)に基づくシステムを提案する。
その結果, 効率と予測の両面で, 新たなアプローチの優位性が示された。
論文 参考訳(メタデータ) (2021-03-31T23:16:29Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。