論文の概要: Eliciting Information with Partial Signals in Repeated Games
- arxiv url: http://arxiv.org/abs/2109.04343v1
- Date: Thu, 9 Sep 2021 15:30:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 19:07:58.972049
- Title: Eliciting Information with Partial Signals in Repeated Games
- Title(参考訳): 繰り返しゲームにおける部分信号による情報抽出
- Authors: Yutong Wu, Ali Khodabakhsh, Bo Li, Evdokia Nikolova, Emmanouil
Pountourakis
- Abstract要約: エージェントが実際のサービス利用を自己報告する必要がある情報ライセンスゲームについて検討する。
エージェントは、信号に矛盾しない限り、任意の情報を報告でき、センターは、報告された情報に基づいて支払いを発行する。
ゲーム中におけるペナルティレートとゲームの長さの組み合わせは,エージェントがゲーム全体に対して誠実であることにインセンティブを与えることを示す。
- 参考スコア(独自算出の注目度): 9.76716150665704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider an information elicitation game where the center needs the agent
to self-report her actual usage of a service and charges her a payment
accordingly. The center can only observe a partial signal, representing part of
the agent's true consumption, that is generated randomly from a publicly known
distribution. The agent can report any information, as long as it does not
contradict the signal, and the center issues a payment based on the reported
information. Such problems find application in prosumer pricing, tax filing,
etc., when the agent's actual consumption of a service is masked from the
center and verification of the submitted reports is impractical. The key
difference between the current problem and classic information elicitation
problems is that the agent gets to observe the full signal and act
strategically, but the center can only see the partial signal. For this
seemingly impossible problem, we propose a penalty mechanism that elicits
truthful self-reports in a repeated game. In particular, besides charging the
agent the reported value, the mechanism charges a penalty proportional to her
inconsistent reports. We show how a combination of the penalty rate and the
length of the game incentivizes the agent to be truthful for the entire game, a
phenomenon we call "fear of tomorrow verification". We show how approximate
results for arbitrary distributions can be obtained by analyzing Bernoulli
distributions. We extend our mechanism to a multi-agent cost sharing setting
and give equilibrium results.
- Abstract(参考訳): センターがエージェントにサービスの実際の使用を自己申告し、それに応じて支払いを請求する情報誘発ゲームについて検討する。
センタは、公的な分布からランダムに生成されるエージェントの真の消費の一部を表す部分的な信号のみを観測できる。
エージェントは、信号と矛盾しない限り、いかなる情報も報告することができ、センターは、報告された情報に基づいて支払いを発行する。
このような問題は、エージェントのサービスの実際の消費がセンターから隠蔽され、提出されたレポートの検証が実用的でない場合に、プロシューマー価格、納税申告等で適用される。
現在の問題と古典的な情報誘発問題の主な違いは、エージェントが全信号を観察して戦略的に行動するが、中央は部分的な信号しか見ることができないことである。
この一見不可能な問題に対して,繰り返しのゲームにおいて真に自己報告を行うペナルティ機構を提案する。
特に、エージェントに報告された価値を課金する以外に、このメカニズムは彼女の矛盾した報告に比例するペナルティを課す。
我々は,ゲームにおけるペナルティ率とゲームの長さの組み合わせが,エージェントに対して,ゲーム全体に対して真正さを動機付けること,すなわち「明日の検証」という現象を示す。
任意の分布に対する近似結果はベルヌーイ分布を解析することによって得られることを示す。
本機構をマルチエージェントコスト共有設定に拡張し,均衡結果を与える。
関連論文リスト
- HSVI-based Online Minimax Strategies for Partially Observable Stochastic Games with Neural Perception Mechanisms [31.51588071503617]
ニューラル認知機構と非対称情報構造を持つ連続状態の部分観測可能なゲームの変種を考察する。
1つのエージェントは部分的な情報を持ち、もう1つのエージェントは状態に関する完全な知識を持っていると仮定される。
本稿では,各エージェントに対して$varepsilon$-minimax戦略プロファイルを計算するための効率的なオンライン手法を提案する。
論文 参考訳(メタデータ) (2024-04-16T15:58:20Z) - Agent Attention: On the Integration of Softmax and Linear Attention [70.06472039237354]
本稿では,計算効率と表現力のバランスをとるために,新しい注意パラダイムであるエージェント注意(Agent Attention)を提案する。
提案するエージェントアテンションは,線形アテンションの一般化形式と等価であることを示す。
特に、エージェントの注意は高解像度のシナリオにおいて顕著な性能を示しており、その線形の注意の性質に依拠している。
論文 参考訳(メタデータ) (2023-12-14T16:26:29Z) - On Imperfect Recall in Multi-Agent Influence Diagrams [57.21088266396761]
マルチエージェント・インフルエンス・ダイアグラム(MAID)はベイズネットワークに基づくゲーム理論モデルとして人気がある。
混合ポリシと2種類の相関平衡を用いて, 忘れ易いエージェントと不注意なエージェントでMAIDを解く方法を示す。
また,不完全なリコールがしばしば避けられないマルコフゲームやチーム状況へのMAIDの適用についても述べる。
論文 参考訳(メタデータ) (2023-07-11T07:08:34Z) - Strategic Resource Selection with Homophilic Agents [48.83208975886834]
類似エージェントとの共同資源利用を目指す異種エージェントを用いたリソース選択ゲームを提案する。
モデルでは,異なるタイプのエージェントを考慮し,その決定的特徴はユーザ間の同一型エージェントの割合である。
このような有界な有理性はゲーム理論上有利な性質を持つことを示す。
論文 参考訳(メタデータ) (2023-05-01T14:14:58Z) - On the Role of Memory in Robust Opinion Dynamics [3.4533036061671973]
我々は,n$同一エージェントと匿名エージェントからなる完全接続システムにおける意見力学について検討する。
あるソースエージェントは、最初は正しい意見を持ち、実行中は、この意見のままである。
ソースがなければ、エージェントは$ell$ランダムエージェントの意見を引き出し、あるルールに従ってその意見を更新する。
論文 参考訳(メタデータ) (2023-02-16T21:53:14Z) - Cooperative Actor-Critic via TD Error Aggregation [12.211031907519827]
本稿では、プライバシー問題に違反しないTDエラーアグリゲーションを備えた分散型アクター批判アルゴリズムを提案する。
我々は,各エージェントが平均目標関数を最大化するために,ステップサイズを小さくして収束解析を行う。
論文 参考訳(メタデータ) (2022-07-25T21:10:39Z) - Multi-Agent Neural Rewriter for Vehicle Routing with Limited Disclosure
of Costs [65.23158435596518]
チームのマルコフゲームとして、部分的に観測可能なコストでマルチサイクルルーティング問題を解く。
我々のマルチエージェント強化学習アプローチである、いわゆるマルチエージェントニューラルリライタは、1エージェントニューラルリライタを利用して、反復的に書き換えるソリューションによって問題を解決する。
論文 参考訳(メタデータ) (2022-06-13T09:17:40Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z) - Signaling in Bayesian Network Congestion Games: the Subtle Power of
Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。
プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文 参考訳(メタデータ) (2020-02-12T19:38:15Z) - Bounded Incentives in Manipulating the Probabilistic Serial Rule [8.309903898123526]
確率的シリアルはインセンティブ互換ではない。
戦略行動による実質的な実用性の向上は、自己関心のエージェントがメカニズムを操作するきっかけとなる。
このメカニズムのインセンティブ比が$frac32$であることを示す。
論文 参考訳(メタデータ) (2020-01-28T23:53:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。