Fugu-MT 論文翻訳(概要): Learning How to Strategically Disclose Information

論文の概要: Learning How to Strategically Disclose Information

arxiv url: http://arxiv.org/abs/2403.08741v1
Date: Wed, 13 Mar 2024 17:44:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-14 13:07:09.689468
Title: Learning How to Strategically Disclose Information
Title（参考訳）: 情報を戦略的に開示する方法を学ぶ
Authors: Raj Kiriti Velicheti, Melih Bastopcu, S. Rasoul Etesami, Tamer Ba\c{s}ar
Abstract要約: 送信者が未知のタイプの受信機と対話する情報設計のオンライン版を考える。我々は、$mathcalO(sqrtT)$ regretが完全な情報フィードバックで達成可能であることを示す。また,一般凸ユーティリティ関数に対して$mathcalO(sqrtT)$ regretを送信者が達成できる新しいパラメトリゼーションを提案する。
参考スコア（独自算出の注目度）: 6.267574471145217
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Strategic information disclosure, in its simplest form, considers a game between an information provider (sender) who has access to some private information that an information receiver is interested in. While the receiver takes an action that affects the utilities of both players, the sender can design information (or modify beliefs) of the receiver through signal commitment, hence posing a Stackelberg game. However, obtaining a Stackelberg equilibrium for this game traditionally requires the sender to have access to the receiver's objective. In this work, we consider an online version of information design where a sender interacts with a receiver of an unknown type who is adversarially chosen at each round. Restricting attention to Gaussian prior and quadratic costs for the sender and the receiver, we show that $\mathcal{O}(\sqrt{T})$ regret is achievable with full information feedback, where $T$ is the total number of interactions between the sender and the receiver. Further, we propose a novel parametrization that allows the sender to achieve $\mathcal{O}(\sqrt{T})$ regret for a general convex utility function. We then consider the Bayesian Persuasion problem with an additional cost term in the objective function, which penalizes signaling policies that are more informative and obtain $\mathcal{O}(\log(T))$ regret. Finally, we establish a sublinear regret bound for the partial information feedback setting and provide simulations to support our theoretical results.
Abstract（参考訳）: 戦略的情報開示は、最も単純な形式で、情報受信者が興味を持っているプライベート情報にアクセス可能な情報提供者(ベンダー)間のゲームを考える。受信機は両方のプレイヤーの効用に影響を与えるアクションを取るが、送信機は信号のコミットメントを通じて受信機の情報(または信条の変更)を設計できるため、スタックルバーグゲームを使用する。しかし、このゲームのスタックルバーグ均衡を得るには、伝統的に送信側は受信者の目的にアクセスできる必要がある。本研究では,各ラウンドで反対に選択された未知のタイプの受信機と送信者が対話するオンライン情報設計について考察する。送信者および受信者に対するガウス的事前及び二次的コストの制限により,$\mathcal{O}(\sqrt{T})$ regretが完全な情報フィードバックによって達成可能であることを示す。さらに,一般凸効用関数に対する$\mathcal{O}(\sqrt{T})$ regret を実現するための新しいパラメトリゼーションを提案する。次に、目的関数のさらなるコスト項でベイズ的説得問題を考察し、より情報的なシグナルポリシーをペナルティ化し、$\mathcal{O}(\log(T))$ regretを得る。最後に,部分的な情報フィードバック設定のためのサブ線形後悔境界を確立し,理論的結果を支援するためのシミュレーションを行う。

関連論文リスト

Algorithmic Persuasion Through Simulation [51.23082754429737]
本研究では,受取人に製品購入などの二元的行動を取るよう説得するベイズ説得ゲームについて検討する。送信者は、製品の品質が高いか低いかなどの世界の(バイナリ)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。顧客の調査やユーザスタディ、最近のAIの進歩によって動機づけられた私たちは、受信者の振る舞いをシミュレートする託宣をクエリすることで、送信側が受信者についてより深く学ぶことを可能にする。
論文参考訳（メタデータ） (2023-11-29T23:01:33Z)
Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文参考訳（メタデータ） (2023-05-08T07:52:15Z)
Vulnerabilities of Deep Learning-Driven Semantic Communications to Backdoor (Trojan) Attacks [70.51799606279883]
本稿では,バックドア(トロイジャン)攻撃に対するディープラーニングによるセマンティックコミュニケーションの脆弱性を明らかにする。バックドア攻撃は、有毒な入力サンプルに転送された意味情報を標的の意味に効果的に変更することができる。バックドア攻撃の有無で情報伝達の意味を保存するための設計ガイドラインが提示される。
論文参考訳（メタデータ） (2022-12-21T17:22:27Z)
Sequential Information Design: Learning to Persuade in the Dark [49.437419242582884]
本研究では,自己関心の受信者の行動に影響を及ぼそうとする情報発信者が直面する繰り返し情報設計問題について検討する。各ラウンドにおいて、送信者は、シーケンシャル意思決定(SDM)問題におけるランダムイベントの実現を観察する。これは、そのような情報をレシーバーに段階的に開示し、彼らが(望まれる)アクションレコメンデーションに従うように説得する方法の課題である。
論文参考訳（メタデータ） (2022-09-08T17:08:12Z)
Multi-Receiver Online Bayesian Persuasion [51.94795123103707]
本研究では,未知の逆選択型の受信者に対して,送信者が繰り返し対面するオンライン学習フレームワークについて検討する。オフラインモデルの慣習として、外部性やバイナリアクションのないケースに重点を置いています。本稿では,損失関数を有限個に制限したオンライン学習問題に対処する一般的なオンライン降下スキームを提案する。
論文参考訳（メタデータ） (2021-06-11T16:05:31Z)
Learning to Persuade on the Fly: Robustness Against Ignorance [26.915262694667746]
送信側と受信側のストリーム間の繰り返しの説得について検討し、その度に送信側は未知の分布から独立に引き出されたペイオフ関連状態を観測する。送信者は、状態情報を選択的に共有することにより、受信者を説得して送信者の好みに沿った行動を取る。標準モデルとは対照的に、送信側も受信側もその分布を知らないため、送信側はオンザフライで分布を学習しながら説得しなければならない。
論文参考訳（メタデータ） (2021-02-19T21:02:15Z)
Signaling in Bayesian Network Congestion Games: the Subtle Power of Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文参考訳（メタデータ） (2020-02-12T19:38:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。