Fugu-MT 論文翻訳(概要): Markovian Embeddings for Coalitional Bargaining Games

論文の概要: Markovian Embeddings for Coalitional Bargaining Games

arxiv url: http://arxiv.org/abs/2306.11104v1
Date: Mon, 19 Jun 2023 18:13:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-21 16:39:02.780759
Title: Markovian Embeddings for Coalitional Bargaining Games
Title（参考訳）: 連立交渉ゲームのためのマルコフ埋め込み
Authors: Lucia Cipolina-Kun
Abstract要約: 連立バーゲティングゲームにおけるマルコフ的特性,特に過去の拒否された提案を繰り返すことができない場合について検討する。本稿では,マルコフアンを球面に埋め込むためのフィルターを用いたマルコフアン埋め込みを提案し,その結果,ゲームの枠組みに適合する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We examine the Markovian properties of coalition bargaining games, in particular, the case where past rejected proposals cannot be repeated. We propose a Markovian embedding with filtrations to render the sates Markovian and thus, fit into the framework of stochastic games.
Abstract（参考訳）: 連立バーゲティングゲームにおけるマルコフ的特性,特に過去の拒否された提案を繰り返すことができない場合について検討する。そこで我々は,sates markovian を表現するためにフィルタを組み込んだマルコフ的埋め込みを提案し,確率的ゲームの枠組みに適合する。

関連論文リスト

The Bakers and Millers Game with Restricted Locations [52.3893099287099]
本研究では,ベイカーズ・アンド・ミラーズ・ゲーム(Bakers and Millers Game)と呼ばれる,顧客と販売者による戦略的位置選択について研究した。最適なバーゲティング力を得るために、パン屋は他のパン屋とほとんど競争せず、多くの製粉業者が小麦粉を買う場所を選択したいと考えた。我々は、より難しい制限された設定でさえ平衡を許容する洗練された効率的なアルゴリズムを通して示している。
論文参考訳（メタデータ） (2025-01-09T15:59:32Z)
A QUBO Formulation for the Generalized LinkedIn Queens and Takuzu/Tango Game [49.1574468325115]
本稿では、LinkedIn Queens ゲームの一連の一般化を解決するために設計された QUBO の定式化について述べる。この定式化は、テンツ・アンド・ツリー (Tents & Trees) のような、問題のいくつかの特定のケースに適応する。また,カラーチェスピース問題 (Coloured Chess Piece Problem) とマックスチェスピース問題 (Max Chess Pieces Problem) という2種類の新しい問題を,対応するQUBOの定式化とともに提示する。
論文参考訳（メタデータ） (2024-10-08T23:54:54Z)
Bi-Entangled Hidden Markov Processes and Recurrence [0.0]
二重絡み合った隠れマルコフ過程は、隠れたプロセス自体が絡み合ったマルコフ過程を示す隠れ量子過程である。これらのプロセスのジョイント期待に関する具体的な公式を提示する。
論文参考訳（メタデータ） (2024-07-12T16:05:55Z)
Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文参考訳（メタデータ） (2023-12-19T11:34:10Z)
Hoeffding's Inequality for Markov Chains under Generalized Concentrability Condition [15.228649445346473]
本稿では,積分確率計量(IPM)によって定義される一般化可積分性条件下でのマルコフ鎖の不等式について検討する。我々のフレームワークの柔軟性により、伝統的な意味でのエルゴード的マルコフ連鎖を超えて、ホーフディングの不等式を適用することができる。
論文参考訳（メタデータ） (2023-10-04T16:21:23Z)
Markov $α$-Potential Games [9.156241608039673]
有限状態および有限作用を持つ任意のマルコフゲームは、マルコフ$alpha$-ポテンシャルゲームであることを示す。実際に重要なマルコフゲーム、2つの重要なクラス、マルコフ混雑ゲーム、摂動マルコフチームゲームについて研究する。
論文参考訳（メタデータ） (2023-05-21T19:27:31Z)
Uncoupled and Convergent Learning in Two-Player Zero-Sum Markov Games with Bandit Feedback [49.1061436241109]
非漸近収束率の非結合、収束、合理的なアルゴリズムの開発に注力する。我々のアルゴリズムは[Chen et al., 2021, Cen et al., 2021]と関係があり、エントロピー正規化技術に基づいている。
論文参考訳（メタデータ） (2023-03-05T18:08:54Z)
Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文参考訳（メタデータ） (2023-02-20T16:05:04Z)
Breaking the Curse of Multiagents in a Large State Space: RL in Markov Games with Independent Linear Function Approximation [56.715186432566576]
そこで本稿では,大規模状態空間と多数のエージェントを用いた強化学習のための新しいモデルである独立線形マルコフゲームを提案する。我々は,各エージェントの関数クラスの複雑性にのみ対応して,サンプル境界複雑性を持つ相関平衡 (CCE) とマルコフ相関平衡 (CE) を学習するための新しいアルゴリズムを設計する。提案アルゴリズムは,1)複数のエージェントによる非定常性に対処するためのポリシーリプレイと,機能近似の利用,2)マルコフ均衡の学習とマルコフゲームにおける探索の分離という,2つの重要な技術革新に依存している。
論文参考訳（メタデータ） (2023-02-07T18:47:48Z)
Markov Abstractions for PAC Reinforcement Learning in Non-Markov Decision Processes [90.53326983143644]
マルコフの抽象概念は強化学習中に学習可能であることを示す。提案手法は,採用アルゴリズムがPACを保証する場合にPACを保証する。
論文参考訳（メタデータ） (2022-04-29T16:53:00Z)
Learn to Match with No Regret: Reinforcement Learning in Markov Matching Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文参考訳（メタデータ） (2022-03-07T19:51:25Z)
Identity testing of reversible Markov chains [4.594159253008449]
我々は、観測の単一の軌道に基づいてマルコフ鎖のアイデンティティテストの問題を検討する。対称性の仮定をより自然な可逆性の仮定に緩和し、参照と未知のマルコフ鎖の両方が同じ定常分布を共有していると仮定する。
論文参考訳（メタデータ） (2021-05-13T15:03:27Z)
Measuring non-Markovianity via incoherent mixing with Markovian dynamics [2.0305676256390934]
非マルコフ性の測定は、非コヒーレント混合によるプロセスに付加しなければならない余剰マルコフ雑音の最小量に基づくものである。任意の次元における偏極展開の集合と、量子ビットに対する退化進化の集合を考慮し、この測定方法を評価する方法を示す。
論文参考訳（メタデータ） (2020-04-07T23:01:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。