論文の概要: Learning How to Strategically Disclose Information
- arxiv url: http://arxiv.org/abs/2403.08741v1
- Date: Wed, 13 Mar 2024 17:44:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 13:07:09.689468
- Title: Learning How to Strategically Disclose Information
- Title(参考訳): 情報を戦略的に開示する方法を学ぶ
- Authors: Raj Kiriti Velicheti, Melih Bastopcu, S. Rasoul Etesami, Tamer
Ba\c{s}ar
- Abstract要約: 送信者が未知のタイプの受信機と対話する情報設計のオンライン版を考える。
我々は、$mathcalO(sqrtT)$ regretが完全な情報フィードバックで達成可能であることを示す。
また,一般凸ユーティリティ関数に対して$mathcalO(sqrtT)$ regretを送信者が達成できる新しいパラメトリゼーションを提案する。
- 参考スコア(独自算出の注目度): 6.267574471145217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Strategic information disclosure, in its simplest form, considers a game
between an information provider (sender) who has access to some private
information that an information receiver is interested in. While the receiver
takes an action that affects the utilities of both players, the sender can
design information (or modify beliefs) of the receiver through signal
commitment, hence posing a Stackelberg game. However, obtaining a Stackelberg
equilibrium for this game traditionally requires the sender to have access to
the receiver's objective. In this work, we consider an online version of
information design where a sender interacts with a receiver of an unknown type
who is adversarially chosen at each round. Restricting attention to Gaussian
prior and quadratic costs for the sender and the receiver, we show that
$\mathcal{O}(\sqrt{T})$ regret is achievable with full information feedback,
where $T$ is the total number of interactions between the sender and the
receiver. Further, we propose a novel parametrization that allows the sender to
achieve $\mathcal{O}(\sqrt{T})$ regret for a general convex utility function.
We then consider the Bayesian Persuasion problem with an additional cost term
in the objective function, which penalizes signaling policies that are more
informative and obtain $\mathcal{O}(\log(T))$ regret. Finally, we establish a
sublinear regret bound for the partial information feedback setting and provide
simulations to support our theoretical results.
- Abstract(参考訳): 戦略的情報開示は、最も単純な形式で、情報受信者が興味を持っているプライベート情報にアクセス可能な情報提供者(ベンダー)間のゲームを考える。
受信機は両方のプレイヤーの効用に影響を与えるアクションを取るが、送信機は信号のコミットメントを通じて受信機の情報(または信条の変更)を設計できるため、スタックルバーグゲームを使用する。
しかし、このゲームのスタックルバーグ均衡を得るには、伝統的に送信側は受信者の目的にアクセスできる必要がある。
本研究では,各ラウンドで反対に選択された未知のタイプの受信機と送信者が対話するオンライン情報設計について考察する。
送信者および受信者に対するガウス的事前及び二次的コストの制限により,$\mathcal{O}(\sqrt{T})$ regretが完全な情報フィードバックによって達成可能であることを示す。
さらに,一般凸効用関数に対する$\mathcal{O}(\sqrt{T})$ regret を実現するための新しいパラメトリゼーションを提案する。
次に、目的関数のさらなるコスト項でベイズ的説得問題を考察し、より情報的なシグナルポリシーをペナルティ化し、$\mathcal{O}(\log(T))$ regretを得る。
最後に,部分的な情報フィードバック設定のためのサブ線形後悔境界を確立し,理論的結果を支援するためのシミュレーションを行う。
関連論文リスト
- Algorithmic Persuasion Through Simulation [54.96278605678665]
本研究では,受信側が受信側を説得し,二元的行動を起こそうとするベイズ的説得問題について考察する。
顧客調査やユーザスタディ、最近のジェネレーティブAIの進歩に動機付けられ、送信側は受信者についてより深く学ぶことができる。
論文 参考訳(メタデータ) (2023-11-29T23:01:33Z) - Attention to Entropic Communication [0.0]
相対エントロピー(relative entropy, RE)は、通信理論において中心的な役割を果たす。
我々はこれらの概念と注意とREを組み合わせ、帯域幅制限通信におけるメッセージの最適な符号化を導出する。
論文 参考訳(メタデータ) (2023-07-21T08:33:55Z) - Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。
計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文 参考訳(メタデータ) (2023-05-08T07:52:15Z) - Vulnerabilities of Deep Learning-Driven Semantic Communications to
Backdoor (Trojan) Attacks [70.51799606279883]
本稿では,バックドア(トロイジャン)攻撃に対するディープラーニングによるセマンティックコミュニケーションの脆弱性を明らかにする。
バックドア攻撃は、有毒な入力サンプルに転送された意味情報を標的の意味に効果的に変更することができる。
バックドア攻撃の有無で情報伝達の意味を保存するための設計ガイドラインが提示される。
論文 参考訳(メタデータ) (2022-12-21T17:22:27Z) - Sequential Information Design: Learning to Persuade in the Dark [49.437419242582884]
本研究では,自己関心の受信者の行動に影響を及ぼそうとする情報発信者が直面する繰り返し情報設計問題について検討する。
各ラウンドにおいて、送信者は、シーケンシャル意思決定(SDM)問題におけるランダムイベントの実現を観察する。
これは、そのような情報をレシーバーに段階的に開示し、彼らが(望まれる)アクションレコメンデーションに従うように説得する方法の課題である。
論文 参考訳(メタデータ) (2022-09-08T17:08:12Z) - Multi-Receiver Online Bayesian Persuasion [51.94795123103707]
本研究では,未知の逆選択型の受信者に対して,送信者が繰り返し対面するオンライン学習フレームワークについて検討する。
オフラインモデルの慣習として、外部性やバイナリアクションのないケースに重点を置いています。
本稿では,損失関数を有限個に制限したオンライン学習問題に対処する一般的なオンライン降下スキームを提案する。
論文 参考訳(メタデータ) (2021-06-11T16:05:31Z) - Signaling in Bayesian Network Congestion Games: the Subtle Power of
Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。
プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文 参考訳(メタデータ) (2020-02-12T19:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。