論文の概要: Bayesian Persuasion with Externalities: Exploiting Agent Types
- arxiv url: http://arxiv.org/abs/2412.12859v1
- Date: Tue, 17 Dec 2024 12:41:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:57:39.051072
- Title: Bayesian Persuasion with Externalities: Exploiting Agent Types
- Title(参考訳): 外部性のあるベイズ的説得:爆発型エージェント
- Authors: Jonathan Shaki, Jiarui Gan, Sarit Kraus,
- Abstract要約: ベイズ的説得問題と外部性について検討する。
このモデルでは、プリンシパルが複数のエージェントに世界の状況を伝える信号を送信する。
本研究は,プリンシパルのための最適なシグナリング戦略の計算問題について考察する。
- 参考スコア(独自算出の注目度): 21.508431216175143
- License:
- Abstract: We study a Bayesian persuasion problem with externalities. In this model, a principal sends signals to inform multiple agents about the state of the world. Simultaneously, due to the existence of externalities in the agents' utilities, the principal also acts as a correlation device to correlate the agents' actions. We consider the setting where the agents are categorized into a small number of types. Agents of the same type share identical utility functions and are treated equitably in the utility functions of both other agents and the principal. We study the problem of computing optimal signaling strategies for the principal, under three different types of signaling channels: public, private, and semi-private. Our results include revelation-principle-style characterizations of optimal signaling strategies, linear programming formulations, and analysis of in/tractability of the optimization problems. It is demonstrated that when the maximum number of deviating agents is bounded by a constant, our LP-based formulations compute optimal signaling strategies in polynomial time. Otherwise, the problems are NP-hard.
- Abstract(参考訳): ベイズ的説得問題と外部性について検討する。
このモデルでは、プリンシパルが複数のエージェントに世界の状況を伝える信号を送信する。
同時に、エージェントのユーティリティに外部性が存在するため、プリンシパルはエージェントのアクションを相関する相関装置としても機能する。
エージェントを少数のタイプに分類する設定について検討する。
同じタイプのエージェントは同一のユーティリティ機能を共有し、他のエージェントとプリンシパルの両方のユーティリティ機能で公平に扱われる。
本研究では,3種類のシグナリングチャネル(パブリック,プライベート,セミプライベートの3種類のシグナリングチャネル)の下で,プリンシパルの最適シグナリング戦略の計算問題について検討する。
本研究の結果は,最適シグナリング戦略のRevelation-principle型評価,線形プログラミングの定式化,最適化問題のイン/トラクタビリティの解析などである。
この結果から, 分散剤の最大数が定数で有界である場合, LPに基づく定式化は多項式時間で最適な信号処理戦略を演算することを示した。
そうでなければ、問題はNPハードである。
関連論文リスト
- Does Worst-Performing Agent Lead the Pack? Analyzing Agent Dynamics in Unified Distributed SGD [7.434126318858966]
分散学習は、異種エージェント間の機械学習アルゴリズムのトレーニングに不可欠である。
我々は統一分散SGD(UD-SGD)の分析を行う。
我々は、UD-SGDの収束速度に、サンプリング、シャッフル、マルコフサンプリングなどの異なるサンプリング戦略がどう影響するかを評価する。
論文 参考訳(メタデータ) (2024-09-26T03:12:20Z) - Principal-Agent Reward Shaping in MDPs [50.914110302917756]
主要な問題とは、ある政党が他の政党に代わって行動し、利害対立を引き起こすことである。
本研究では,主役とエージェントが異なる報酬関数を持つ2人プレイのスタックゲームについて検討し,エージェントは両プレイヤーに対してMDPポリシーを選択する。
この結果は,有限の地平線を持つ木と決定論的決定過程を確立した。
論文 参考訳(メタデータ) (2023-12-30T18:30:44Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Multi-agent Policy Optimization with Approximatively Synchronous
Advantage Estimation [55.96893934962757]
マルチエージェントシステムでは、異なるエージェントの警察を共同で評価する必要がある。
現在の方法では、バリュー関数やアドバンテージ関数は非同期に評価される対実関節アクションを使用する。
本研究では,近似的に同期する利点推定を提案する。
論文 参考訳(メタデータ) (2020-12-07T07:29:19Z) - Heterogeneous Explore-Exploit Strategies on Multi-Star Networks [0.0]
エージェントがマルチスターネットワーク上で通信する分散帯域幅問題について検討する。
モデル不規則ネットワークグラフとしてマルチスターを用いた異種探索探索戦略を提案する。
論文 参考訳(メタデータ) (2020-09-02T20:56:49Z) - Multiagent Value Iteration Algorithms in Dynamic Programming and
Reinforcement Learning [0.0]
各段階における制御がいくつかの異なる決定から構成される無限水平動的プログラミング問題を考える。
以前の研究では、ポリシーの反復アルゴリズムを導入しました。
論文 参考訳(メタデータ) (2020-05-04T16:34:24Z) - Public Bayesian Persuasion: Being Almost Optimal and Almost Persuasive [57.47546090379434]
i) 任意の状態空間, (ii) 任意の行動空間, (iii) 任意の送信者のユーティリティ関数を用いて, 一般の状況下での公衆の説得問題を考察する。
任意の公的な説得問題に対して準多項式時間ビクテリア近似アルゴリズムを提案し、特定の設定でQPTASを出力する。
論文 参考訳(メタデータ) (2020-02-12T18:59:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。