論文の概要: Commitment with Signaling under Double-sided Information Asymmetry
- arxiv url: http://arxiv.org/abs/2212.11446v1
- Date: Thu, 22 Dec 2022 01:30:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 15:32:00.346732
- Title: Commitment with Signaling under Double-sided Information Asymmetry
- Title(参考訳): 双方向情報非対称性下でのシグナリングへのコミットメント
- Authors: Tao Li and Quanyan Zhu
- Abstract要約: この研究は、ベイジアン・スタックルバーグのゲームにおいて、両面の情報非対称性を考える。
我々は,リーダが実現した行動に関する部分的な情報をフォロワーに開示するシグナリング装置を適切に設計することにより,シグナリングなしでより高い実用性を実現することができることを示す。
- 参考スコア(独自算出の注目度): 26.714015736301292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Information asymmetry in games enables players with the information advantage
to manipulate others' beliefs by strategically revealing information to other
players. This work considers a double-sided information asymmetry in a Bayesian
Stackelberg game, where the leader's realized action, sampled from the mixed
strategy commitment, is hidden from the follower. In contrast, the follower
holds private information about his payoff. Given asymmetric information on
both sides, an important question arises: \emph{Does the leader's information
advantage outweigh the follower's?} We answer this question affirmatively in
this work, where we demonstrate that by adequately designing a signaling device
that reveals partial information regarding the leader's realized action to the
follower, the leader can achieve a higher expected utility than that without
signaling. Moreover, unlike previous works on the Bayesian Stackelberg game
where mathematical programming tools are utilized, we interpret the leader's
commitment as a probability measure over the belief space. Such a probabilistic
language greatly simplifies the analysis and allows an indirect signaling
scheme, leading to a geometric characterization of the equilibrium under the
proposed game model.
- Abstract(参考訳): ゲームにおける情報非対称性は、他のプレイヤーに戦略的に情報を開示することで、情報有利なプレイヤーが他人の信念を操作することを可能にする。
この研究はバイエルン・スタックルベルグのゲームにおいて、混合戦略のコミットメントからサンプリングされたリーダーの実際の行動が従者から隠された両面の情報非対称性を考える。
対照的に、フォロワーは自分の支払いに関する情報をプライベートに保持している。
双方に非対称な情報を与えると、重要な疑問が生じる: \emph{es the leader's information advantage than the followinger's?
ここで、我々は、リーダーが実行した行動に関する部分的な情報を明らかにするシグナル装置を適切に設計することで、リーダーが合図無しに、より高い期待する有用性を達成することができることを実証する。
さらに、数学プログラミングツールを利用するベイジアン・スタックルバーグゲームにおける以前の作品とは異なり、指導者のコミットメントを信念空間上の確率測度として解釈する。
このような確率的言語は解析を大幅に単純化し、間接的なシグナリングスキームを許容し、提案したゲームモデルの下での平衡の幾何学的特徴付けに繋がる。
関連論文リスト
- Decentralized Online Learning in General-Sum Stackelberg Games [2.8659922790025463]
プレイヤーが分散的かつ戦略的に行動する一般のStackelbergゲームにおいて,オンライン学習問題を研究する。
我々は、フォロワーにとって、リーダーの行動にミオプティカルに最も反応することが、限られた情報設定にとって最良の戦略であることを示す。
後者の設定では、フォロワーに対する新たな操作戦略を設計し、最良の応答戦略に対して本質的な優位性を示す。
論文 参考訳(メタデータ) (2024-05-06T04:35:01Z) - When Should a Leader Act Suboptimally? The Role of Inferability in Repeated Stackelberg Games [28.856644679990357]
我々は、リーダーとフォロワーが繰り返し対話する観察結果を用いて、Stackelbergゲームを用いて、推論可能性の問題をモデル化する。
様々なゲーム設定において、不確実性ギャップは、リーダーの戦略の相互作用数とセマンティレベルの関数によって上限づけられていることが示される。
リーダーの準最適戦略が大きな不確実性ギャップに悩まされるような一連のゲームを特定する。
論文 参考訳(メタデータ) (2023-09-30T19:08:05Z) - Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。
計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文 参考訳(メタデータ) (2023-05-08T07:52:15Z) - Learning to Manipulate a Commitment Optimizer [14.806314018261416]
最近の研究によると、スタックルバーグのゲームでは、フォロワーは真のベストレスポンス行動から逸脱してリーダーを操作することができる。
これらの発見が示すリスクは、操作が依存する厳密な情報によってある程度軽減されているように見える。
まずは、フォロワーがリーダーの報酬に関する情報を与えられず、リーダーと対話して操作を学ばなければならないシナリオを考えます。
論文 参考訳(メタデータ) (2023-02-23T07:39:37Z) - A Bayesian Framework for Information-Theoretic Probing [51.98576673620385]
我々は、探索は相互情報を近似するものとみなすべきであると論じる。
これは、表現が元の文とターゲットタスクに関する全く同じ情報をエンコードしているというかなり直感的な結論を導いた。
本稿では,ベイズ的相互情報(Bayesian mutual information)と呼ぶものを測定するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-08T18:08:36Z) - Adversarial Training as Stackelberg Game: An Unrolled Optimization
Approach [91.74682538906691]
逆行訓練はディープラーニングモデルの一般化性能を向上させることが示されている。
Stackelbergゲームとして, 対人トレーニングを定式化するStackelberg Adversarial Training (SALT)を提案する。
論文 参考訳(メタデータ) (2021-04-11T00:44:57Z) - Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games [78.65798135008419]
一般的なゲームでStackelberg平衡を効率的に学習する方法は、サンプルから非常にオープンなままです。
本稿では,2プレーヤターンベース汎用ゲームにおけるStackelberg平衡のサンプル効率学習に関する理論的研究を開始する。
論文 参考訳(メタデータ) (2021-02-23T05:11:07Z) - On Information Asymmetry in Competitive Multi-Agent Reinforcement
Learning: Convergence and Optimality [78.76529463321374]
協調的でない2つのQ-ラーニングエージェントの相互作用システムについて検討する。
この情報非対称性は、集団学習の安定した結果をもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2020-10-21T11:19:53Z) - Model-free Reinforcement Learning for Stochastic Stackelberg Security
Games [7.470839530834359]
リーダーとフォロワーの2人のプレイヤーによる連続的なStackelbergゲームについて検討する。
フォロワーはシステムの状態にアクセスでき、リーダーはアクセスしない。
本稿では,MDPのモデルをシミュレートして,スタックルバーグ均衡政策を学習する予測サーサに基づくRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-24T22:34:20Z) - Signaling in Bayesian Network Congestion Games: the Subtle Power of
Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。
プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文 参考訳(メタデータ) (2020-02-12T19:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。