論文の概要: Markovian Embeddings for Coalitional Bargaining Games
- arxiv url: http://arxiv.org/abs/2306.11104v1
- Date: Mon, 19 Jun 2023 18:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 16:39:02.780759
- Title: Markovian Embeddings for Coalitional Bargaining Games
- Title(参考訳): 連立交渉ゲームのためのマルコフ埋め込み
- Authors: Lucia Cipolina-Kun
- Abstract要約: 連立バーゲティングゲームにおけるマルコフ的特性,特に過去の拒否された提案を繰り返すことができない場合について検討する。
本稿では,マルコフアンを球面に埋め込むためのフィルターを用いたマルコフアン埋め込みを提案し,その結果,ゲームの枠組みに適合する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We examine the Markovian properties of coalition bargaining games, in
particular, the case where past rejected proposals cannot be repeated. We
propose a Markovian embedding with filtrations to render the sates Markovian
and thus, fit into the framework of stochastic games.
- Abstract(参考訳): 連立バーゲティングゲームにおけるマルコフ的特性,特に過去の拒否された提案を繰り返すことができない場合について検討する。
そこで我々は,sates markovian を表現するためにフィルタを組み込んだマルコフ的埋め込みを提案し,確率的ゲームの枠組みに適合する。
関連論文リスト
- The Bakers and Millers Game with Restricted Locations [52.3893099287099]
本研究では,ベイカーズ・アンド・ミラーズ・ゲーム(Bakers and Millers Game)と呼ばれる,顧客と販売者による戦略的位置選択について研究した。
最適なバーゲティング力を得るために、パン屋は他のパン屋とほとんど競争せず、多くの製粉業者が小麦粉を買う場所を選択したいと考えた。
我々は、より難しい制限された設定でさえ平衡を許容する洗練された効率的なアルゴリズムを通して示している。
論文 参考訳(メタデータ) (2025-01-09T15:59:32Z) - A QUBO Formulation for the Generalized LinkedIn Queens and Takuzu/Tango Game [49.1574468325115]
本稿では、LinkedIn Queens ゲームの一連の一般化を解決するために設計された QUBO の定式化について述べる。
この定式化は、テンツ・アンド・ツリー (Tents & Trees) のような、問題のいくつかの特定のケースに適応する。
また,カラーチェスピース問題 (Coloured Chess Piece Problem) とマックスチェスピース問題 (Max Chess Pieces Problem) という2種類の新しい問題を,対応するQUBOの定式化とともに提示する。
論文 参考訳(メタデータ) (2024-10-08T23:54:54Z) - Bi-Entangled Hidden Markov Processes and Recurrence [0.0]
二重絡み合った隠れマルコフ過程は、隠れたプロセス自体が絡み合ったマルコフ過程を示す隠れ量子過程である。
これらのプロセスのジョイント期待に関する具体的な公式を提示する。
論文 参考訳(メタデータ) (2024-07-12T16:05:55Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Hoeffding's Inequality for Markov Chains under Generalized
Concentrability Condition [15.228649445346473]
本稿では,積分確率計量(IPM)によって定義される一般化可積分性条件下でのマルコフ鎖の不等式について検討する。
我々のフレームワークの柔軟性により、伝統的な意味でのエルゴード的マルコフ連鎖を超えて、ホーフディングの不等式を適用することができる。
論文 参考訳(メタデータ) (2023-10-04T16:21:23Z) - Markov $α$-Potential Games [9.156241608039673]
有限状態および有限作用を持つ任意のマルコフゲームは、マルコフ$alpha$-ポテンシャルゲームであることを示す。
実際に重要なマルコフゲーム、2つの重要なクラス、マルコフ混雑ゲーム、摂動マルコフチームゲームについて研究する。
論文 参考訳(メタデータ) (2023-05-21T19:27:31Z) - Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。
低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。
上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文 参考訳(メタデータ) (2023-02-20T16:05:04Z) - Markov Abstractions for PAC Reinforcement Learning in Non-Markov
Decision Processes [90.53326983143644]
マルコフの抽象概念は強化学習中に学習可能であることを示す。
提案手法は,採用アルゴリズムがPACを保証する場合にPACを保証する。
論文 参考訳(メタデータ) (2022-04-29T16:53:00Z) - Learn to Match with No Regret: Reinforcement Learning in Markov Matching
Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。
本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。
我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文 参考訳(メタデータ) (2022-03-07T19:51:25Z) - Identity testing of reversible Markov chains [4.594159253008449]
我々は、観測の単一の軌道に基づいてマルコフ鎖のアイデンティティテストの問題を検討する。
対称性の仮定をより自然な可逆性の仮定に緩和し、参照と未知のマルコフ鎖の両方が同じ定常分布を共有していると仮定する。
論文 参考訳(メタデータ) (2021-05-13T15:03:27Z) - Measuring non-Markovianity via incoherent mixing with Markovian dynamics [2.0305676256390934]
非マルコフ性の測定は、非コヒーレント混合によるプロセスに付加しなければならない余剰マルコフ雑音の最小量に基づくものである。
任意の次元における偏極展開の集合と、量子ビットに対する退化進化の集合を考慮し、この測定方法を評価する方法を示す。
論文 参考訳(メタデータ) (2020-04-07T23:01:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。