論文の概要: Bayesian Promised Persuasion: Dynamic Forward-Looking Multiagent
Delegation with Informational Burning
- arxiv url: http://arxiv.org/abs/2201.06081v1
- Date: Sun, 16 Jan 2022 16:29:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 18:43:49.407974
- Title: Bayesian Promised Persuasion: Dynamic Forward-Looking Multiagent
Delegation with Informational Burning
- Title(参考訳): ベイズが約束する説得:情報燃焼を伴う動的前方型マルチエージェント代表団
- Authors: Tao Zhang, Quanyan Zhu
- Abstract要約: 本研究では,プライマリエージェントがプライベートエージェントのグループに決定を委譲する動的メカニズム設計問題について検討する。
本稿では,ベイジアン約束代行(BPD)と呼ばれる新しいランダム化機構を提案する。
- 参考スコア(独自算出の注目度): 24.659220263852024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work studies a dynamic mechanism design problem in which a principal
delegates decision makings to a group of privately-informed agents without the
monetary transfer or burning. We consider that the principal privately
possesses complete knowledge about the state transitions and study how she can
use her private observation to support the incentive compatibility of the
delegation via informational burning, a process we refer to as the
looking-forward persuasion. The delegation mechanism is formulated in which the
agents form belief hierarchies due to the persuasion and play a dynamic
Bayesian game. We propose a novel randomized mechanism, known as Bayesian
promised delegation (BPD), in which the periodic incentive compatibility is
guaranteed by persuasions and promises of future delegations. We show that the
BPD can achieve the same optimal social welfare as the original mechanism in
stationary Markov perfect Bayesian equilibria. A revelation-principle-like
design regime is established to show that the persuasion with belief
hierarchies can be fully characterized by correlating the randomization of the
agents' local BPD mechanisms with the persuasion as a direct recommendation of
the future promises.
- Abstract(参考訳): 本研究は,主要因が金銭移動や燃焼を伴わない私的情報伝達エージェント群に決定を委譲する動的機構設計問題を研究する。
校長は、国家移行に関する完全な知識を私的に持っており、情報燃焼による代表団のインセンティブ整合を支援するために、どのように私的な観察を利用できるかを研究している。
委譲機構は、エージェントが説得によって信念階層を形成し、動的ベイズゲームを行うように定式化される。
我々は,将来の代表団の説得と約束によって周期的インセンティブの互換性が保証される,bayesian promised delegate (bpd) と呼ばれる新しいランダム化機構を提案する。
bpdは,定常マルコフ完全ベイズ均衡における本来のメカニズムと同じ最適な社会福祉を実現することができることを示した。
エージェントの局所的BPD機構のランダム化とパースを関連づけることで, 信念階層による説得が, 将来の約束の直接の推薦として実現可能であることを示すために, 啓示原理のような設計体制が確立されている。
関連論文リスト
- Interpretable Concept-Based Memory Reasoning [12.562474638728194]
コンセプトベースのメモリリゾナー(CMR)は、人間に理解でき、検証可能なタスク予測プロセスを提供するために設計された新しいCBMである。
CMRは、最先端のCBMに対する精度-解釈可能性のトレードオフを向上し、基礎的な真実と整合した論理規則を発見し、規則の介入を可能にし、事前デプロイ検証を可能にする。
論文 参考訳(メタデータ) (2024-07-22T10:32:48Z) - Leveraging Counterfactual Paths for Contrastive Explanations of POMDP Policies [2.4332936182093197]
XAIは、エージェント行動の説明を提供することで、混乱を減らし、システムの信頼を高めることを目的としている。
POMDPは、遷移と状態の不確実性を推論できる柔軟なフレームワークを提供する。
本研究は,POMDPポリシーの対照的な説明を生成するために,ユーザが提供する反ファクトファクトの活用について検討する。
論文 参考訳(メタデータ) (2024-03-28T18:19:38Z) - A Semantic Approach to Decidability in Epistemic Planning (Extended
Version) [72.77805489645604]
我々は決定可能性を達成するために新しい意味論的アプローチを用いる。
具体的には、知識の論理S5$_n$と(知識)可換性と呼ばれる相互作用公理を拡大する。
我々は,本フレームワークが,独立した知識である共通知識の有限的非固定点的特徴を認めていることを証明した。
論文 参考訳(メタデータ) (2023-07-28T11:26:26Z) - An Analysis of Attention via the Lens of Exchangeability and Latent Variable Models [64.87562101662952]
入力トークンは、位置エンコーディングを含むため、しばしば交換可能であることを示す。
我々は入力トークンの十分かつ最小限の表現の存在を確立する。
所望パラメータの注意が近似誤差まで潜伏した後部を推定することを証明する。
論文 参考訳(メタデータ) (2022-12-30T17:59:01Z) - Differentially Private Counterfactuals via Functional Mechanism [47.606474009932825]
本稿では,デプロイされたモデルや説明セットに触れることなく,差分的プライベート・カウンティファクト(DPC)を生成する新しいフレームワークを提案する。
特に、ノイズの多いクラスプロトタイプを構築するための機能機構を備えたオートエンコーダを訓練し、次に潜伏プロトタイプからDPCを導出する。
論文 参考訳(メタデータ) (2022-08-04T20:31:22Z) - Properties from Mechanisms: An Equivariance Perspective on Identifiable
Representation Learning [79.4957965474334]
教師なし表現学習の主な目標は、データ生成プロセスが潜在プロパティを回復するために「反転」することである。
この論文は「進化を支配するメカニズムの知識を活用して潜伏特性を識別するのか?」と問う。
我々は、可能なメカニズムの集合に関する知識が異なるため、不特定性の原因の完全な特徴づけを提供する。
論文 参考訳(メタデータ) (2021-10-29T14:04:08Z) - Building Affordance Relations for Robotic Agents - A Review [7.50722199393581]
Affordancesは、エージェントがオブジェクトでアクションを実行する可能性を記述する。
我々は,ロボット作業における余裕の概念を用いて,さまざまな戦略の共通基盤をレビューし,発見する。
AIエージェントの能力を向上させる可能性を秘めたアプライアンスを含むさまざまな興味深い研究方向を特定し、議論します。
論文 参考訳(メタデータ) (2021-05-14T08:35:18Z) - Informational Design of Dynamic Multi-Agent System [32.37168850559519]
報償関連環境信号の技術がインテリジェントエージェントの行動にどのように影響するかを研究する。
直接的な情報設計に焦点を合わせることは一般性の損失がないと述べる従順な原則が確立されます。
エージェントにプリンシパルが送信する信号を選択するインセンティブを与える固定点アライメント(fix-point alignment)と呼ばれるアプローチに基づいて、フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-07T03:46:14Z) - Transformers with Competitive Ensembles of Independent Mechanisms [97.93090139318294]
隠れた表現とパラメータを複数のメカニズムに分割し、注意を通して情報を交換する新しいトランスフォーマー層を提案する。
TIM を大規模 BERT モデル、画像変換器、および音声強調について研究し、意味的に意味のある専門化とパフォーマンスの向上の証拠を見つけます。
論文 参考訳(メタデータ) (2021-02-27T21:48:46Z) - Modelling Agent Policies with Interpretable Imitation Learning [12.858982225307809]
MDP環境における逆エンジニアリングブラックボックスエージェントポリシーにおける模倣学習のアプローチについて概説する。
我々はマルコフ状態から構築された多数の候補特徴空間からエージェントの潜在状態表現を明示的にモデル化し学習する。
論文 参考訳(メタデータ) (2020-06-19T18:19:08Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。