論文の概要: Commitment with Signaling under Double-sided Information Asymmetry
- arxiv url: http://arxiv.org/abs/2212.11446v1
- Date: Thu, 22 Dec 2022 01:30:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 15:32:00.346732
- Title: Commitment with Signaling under Double-sided Information Asymmetry
- Title(参考訳): 双方向情報非対称性下でのシグナリングへのコミットメント
- Authors: Tao Li and Quanyan Zhu
- Abstract要約: この研究は、ベイジアン・スタックルバーグのゲームにおいて、両面の情報非対称性を考える。
我々は,リーダが実現した行動に関する部分的な情報をフォロワーに開示するシグナリング装置を適切に設計することにより,シグナリングなしでより高い実用性を実現することができることを示す。
- 参考スコア(独自算出の注目度): 26.714015736301292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Information asymmetry in games enables players with the information advantage
to manipulate others' beliefs by strategically revealing information to other
players. This work considers a double-sided information asymmetry in a Bayesian
Stackelberg game, where the leader's realized action, sampled from the mixed
strategy commitment, is hidden from the follower. In contrast, the follower
holds private information about his payoff. Given asymmetric information on
both sides, an important question arises: \emph{Does the leader's information
advantage outweigh the follower's?} We answer this question affirmatively in
this work, where we demonstrate that by adequately designing a signaling device
that reveals partial information regarding the leader's realized action to the
follower, the leader can achieve a higher expected utility than that without
signaling. Moreover, unlike previous works on the Bayesian Stackelberg game
where mathematical programming tools are utilized, we interpret the leader's
commitment as a probability measure over the belief space. Such a probabilistic
language greatly simplifies the analysis and allows an indirect signaling
scheme, leading to a geometric characterization of the equilibrium under the
proposed game model.
- Abstract(参考訳): ゲームにおける情報非対称性は、他のプレイヤーに戦略的に情報を開示することで、情報有利なプレイヤーが他人の信念を操作することを可能にする。
この研究はバイエルン・スタックルベルグのゲームにおいて、混合戦略のコミットメントからサンプリングされたリーダーの実際の行動が従者から隠された両面の情報非対称性を考える。
対照的に、フォロワーは自分の支払いに関する情報をプライベートに保持している。
双方に非対称な情報を与えると、重要な疑問が生じる: \emph{es the leader's information advantage than the followinger's?
ここで、我々は、リーダーが実行した行動に関する部分的な情報を明らかにするシグナル装置を適切に設計することで、リーダーが合図無しに、より高い期待する有用性を達成することができることを実証する。
さらに、数学プログラミングツールを利用するベイジアン・スタックルバーグゲームにおける以前の作品とは異なり、指導者のコミットメントを信念空間上の確率測度として解釈する。
このような確率的言語は解析を大幅に単純化し、間接的なシグナリングスキームを許容し、提案したゲームモデルの下での平衡の幾何学的特徴付けに繋がる。
関連論文リスト
- Regret Minimization in Stackelberg Games with Side Information [50.270531339600495]
Stackelbergゲーム (Stackelberg game) は、リーダーが(混合)戦略にコミットし、フォロワーがベスト対応する2人プレイのゲームである。
本研究は, リーダが全敵的設定で優れたパフォーマンス(後悔によって測られる)を達成することは不可能であることを示す。
論文 参考訳(メタデータ) (2024-02-13T16:24:57Z) - Learning to Manipulate a Commitment Optimizer [14.806314018261416]
最近の研究によると、スタックルバーグのゲームでは、フォロワーは真のベストレスポンス行動から逸脱してリーダーを操作することができる。
これらの発見が示すリスクは、操作が依存する厳密な情報によってある程度軽減されているように見える。
まずは、フォロワーがリーダーの報酬に関する情報を与えられず、リーダーと対話して操作を学ばなければならないシナリオを考えます。
論文 参考訳(メタデータ) (2023-02-23T07:39:37Z) - Uncoupled Learning of Differential Stackelberg Equilibria with
Commitments [36.08560307852286]
我々は,各プレイヤーの学習更新が相手の行動の観察にのみ依存する未結合の学習過程を示す。
この過程は, 従来と類似した条件下で局所的なスタックルバーグ平衡に収束することが証明された。
論文 参考訳(メタデータ) (2023-02-07T12:46:54Z) - Optimal Private Payoff Manipulation against Commitment in Extensive-form
Games [7.739432465414604]
広義のゲームにおいて,このような戦略行動を通じて従者の最適操作について検討する。
我々は、フォロワーが自分のプライベートペイオフを誤報告する最適な方法を見つけるのが難しかったことを示します。
論文 参考訳(メタデータ) (2022-06-27T08:50:28Z) - A Bayesian Framework for Information-Theoretic Probing [51.98576673620385]
我々は、探索は相互情報を近似するものとみなすべきであると論じる。
これは、表現が元の文とターゲットタスクに関する全く同じ情報をエンコードしているというかなり直感的な結論を導いた。
本稿では,ベイズ的相互情報(Bayesian mutual information)と呼ぶものを測定するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-08T18:08:36Z) - Adversarial Training as Stackelberg Game: An Unrolled Optimization
Approach [91.74682538906691]
逆行訓練はディープラーニングモデルの一般化性能を向上させることが示されている。
Stackelbergゲームとして, 対人トレーニングを定式化するStackelberg Adversarial Training (SALT)を提案する。
論文 参考訳(メタデータ) (2021-04-11T00:44:57Z) - Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games [78.65798135008419]
一般的なゲームでStackelberg平衡を効率的に学習する方法は、サンプルから非常にオープンなままです。
本稿では,2プレーヤターンベース汎用ゲームにおけるStackelberg平衡のサンプル効率学習に関する理論的研究を開始する。
論文 参考訳(メタデータ) (2021-02-23T05:11:07Z) - On Information Asymmetry in Competitive Multi-Agent Reinforcement
Learning: Convergence and Optimality [78.76529463321374]
協調的でない2つのQ-ラーニングエージェントの相互作用システムについて検討する。
この情報非対称性は、集団学習の安定した結果をもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2020-10-21T11:19:53Z) - Model-free Reinforcement Learning for Stochastic Stackelberg Security
Games [7.470839530834359]
リーダーとフォロワーの2人のプレイヤーによる連続的なStackelbergゲームについて検討する。
フォロワーはシステムの状態にアクセスでき、リーダーはアクセスしない。
本稿では,MDPのモデルをシミュレートして,スタックルバーグ均衡政策を学習する予測サーサに基づくRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-24T22:34:20Z) - Signaling in Bayesian Network Congestion Games: the Subtle Power of
Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。
プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文 参考訳(メタデータ) (2020-02-12T19:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。