論文の概要: Markovian Embeddings for Coalitional Bargaining Games
- arxiv url: http://arxiv.org/abs/2306.11104v1
- Date: Mon, 19 Jun 2023 18:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 16:39:02.780759
- Title: Markovian Embeddings for Coalitional Bargaining Games
- Title(参考訳): 連立交渉ゲームのためのマルコフ埋め込み
- Authors: Lucia Cipolina-Kun
- Abstract要約: 連立バーゲティングゲームにおけるマルコフ的特性,特に過去の拒否された提案を繰り返すことができない場合について検討する。
本稿では,マルコフアンを球面に埋め込むためのフィルターを用いたマルコフアン埋め込みを提案し,その結果,ゲームの枠組みに適合する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We examine the Markovian properties of coalition bargaining games, in
particular, the case where past rejected proposals cannot be repeated. We
propose a Markovian embedding with filtrations to render the sates Markovian
and thus, fit into the framework of stochastic games.
- Abstract(参考訳): 連立バーゲティングゲームにおけるマルコフ的特性,特に過去の拒否された提案を繰り返すことができない場合について検討する。
そこで我々は,sates markovian を表現するためにフィルタを組み込んだマルコフ的埋め込みを提案し,確率的ゲームの枠組みに適合する。
関連論文リスト
- Bi-Entangled Hidden Markov Processes and Recurrence [0.0]
二重絡み合った隠れマルコフ過程は、隠れたプロセス自体が絡み合ったマルコフ過程を示す隠れ量子過程である。
これらのプロセスのジョイント期待に関する具体的な公式を提示する。
論文 参考訳(メタデータ) (2024-07-12T16:05:55Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Hoeffding's Inequality for Markov Chains under Generalized
Concentrability Condition [15.228649445346473]
本稿では,積分確率計量(IPM)によって定義される一般化可積分性条件下でのマルコフ鎖の不等式について検討する。
我々のフレームワークの柔軟性により、伝統的な意味でのエルゴード的マルコフ連鎖を超えて、ホーフディングの不等式を適用することができる。
論文 参考訳(メタデータ) (2023-10-04T16:21:23Z) - Markov $α$-Potential Games [9.156241608039673]
有限状態および有限作用を持つ任意のマルコフゲームは、マルコフ$alpha$-ポテンシャルゲームであることを示す。
実際に重要なマルコフゲーム、2つの重要なクラス、マルコフ混雑ゲーム、摂動マルコフチームゲームについて研究する。
論文 参考訳(メタデータ) (2023-05-21T19:27:31Z) - Uncoupled and Convergent Learning in Two-Player Zero-Sum Markov Games
with Bandit Feedback [49.1061436241109]
非漸近収束率の非結合、収束、合理的なアルゴリズムの開発に注力する。
我々のアルゴリズムは[Chen et al., 2021, Cen et al., 2021]と関係があり、エントロピー正規化技術に基づいている。
論文 参考訳(メタデータ) (2023-03-05T18:08:54Z) - Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。
低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。
上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文 参考訳(メタデータ) (2023-02-20T16:05:04Z) - Breaking the Curse of Multiagents in a Large State Space: RL in Markov
Games with Independent Linear Function Approximation [56.715186432566576]
そこで本稿では,大規模状態空間と多数のエージェントを用いた強化学習のための新しいモデルである独立線形マルコフゲームを提案する。
我々は,各エージェントの関数クラスの複雑性にのみ対応して,サンプル境界複雑性を持つ相関平衡 (CCE) とマルコフ相関平衡 (CE) を学習するための新しいアルゴリズムを設計する。
提案アルゴリズムは,1)複数のエージェントによる非定常性に対処するためのポリシーリプレイと,機能近似の利用,2)マルコフ均衡の学習とマルコフゲームにおける探索の分離という,2つの重要な技術革新に依存している。
論文 参考訳(メタデータ) (2023-02-07T18:47:48Z) - Markov Abstractions for PAC Reinforcement Learning in Non-Markov
Decision Processes [90.53326983143644]
マルコフの抽象概念は強化学習中に学習可能であることを示す。
提案手法は,採用アルゴリズムがPACを保証する場合にPACを保証する。
論文 参考訳(メタデータ) (2022-04-29T16:53:00Z) - Learn to Match with No Regret: Reinforcement Learning in Markov Matching
Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。
本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。
我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文 参考訳(メタデータ) (2022-03-07T19:51:25Z) - Identity testing of reversible Markov chains [4.594159253008449]
我々は、観測の単一の軌道に基づいてマルコフ鎖のアイデンティティテストの問題を検討する。
対称性の仮定をより自然な可逆性の仮定に緩和し、参照と未知のマルコフ鎖の両方が同じ定常分布を共有していると仮定する。
論文 参考訳(メタデータ) (2021-05-13T15:03:27Z) - Measuring non-Markovianity via incoherent mixing with Markovian dynamics [2.0305676256390934]
非マルコフ性の測定は、非コヒーレント混合によるプロセスに付加しなければならない余剰マルコフ雑音の最小量に基づくものである。
任意の次元における偏極展開の集合と、量子ビットに対する退化進化の集合を考慮し、この測定方法を評価する方法を示す。
論文 参考訳(メタデータ) (2020-04-07T23:01:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。