論文の概要: From Behavioral Theories to Econometrics: Inferring Preferences of Human
Agents from Data on Repeated Interactions
- arxiv url: http://arxiv.org/abs/2112.15151v1
- Date: Thu, 30 Dec 2021 18:06:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 00:18:51.799710
- Title: From Behavioral Theories to Econometrics: Inferring Preferences of Human
Agents from Data on Repeated Interactions
- Title(参考訳): 行動理論から経済学へ:反復的相互作用データから人間エージェントの選好を推定する
- Authors: Gali Noti
- Abstract要約: 我々は、エージェントが繰り返し対話する戦略システムのデータから、人間のエージェントの嗜好を推定する問題を考察する。
2x2ゲームの実験データを用いて,4つの挙動平衡法の推定成功度を評価する。
結果は、それらの推定値がナッシュ均衡の推定値よりも正確であることを示している。
- 参考スコア(独自算出の注目度): 2.741266294612776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of estimating preferences of human agents from data
of strategic systems where the agents repeatedly interact. Recently, it was
demonstrated that a new estimation method called "quantal regret" produces more
accurate estimates for human agents than the classic approach that assumes that
agents are rational and reach a Nash equilibrium; however, this method has not
been compared to methods that take into account behavioral aspects of human
play. In this paper we leverage equilibrium concepts from behavioral economics
for this purpose and ask how well they perform compared to the quantal regret
and Nash equilibrium methods. We develop four estimation methods based on
established behavioral equilibrium models to infer the utilities of human
agents from observed data of normal-form games. The equilibrium models we study
are quantal-response equilibrium, action-sampling equilibrium, payoff-sampling
equilibrium, and impulse-balance equilibrium. We show that in some of these
concepts the inference is achieved analytically via closed formulas, while in
the others the inference is achieved only algorithmically. We use experimental
data of 2x2 games to evaluate the estimation success of these behavioral
equilibrium methods. The results show that the estimates they produce are more
accurate than the estimates of the Nash equilibrium. The comparison with the
quantal-regret method shows that the behavioral methods have better hit rates,
but the quantal-regret method performs better in terms of the overall mean
squared error, and we discuss the differences between the methods.
- Abstract(参考訳): エージェントが繰り返し相互作用する戦略システムのデータから,人間エージェントの選好を推定する問題を考える。
近年,「量的後悔」と呼ばれる新たな推定手法が,エージェントが合理的でnash平衡に達すると仮定する従来のアプローチよりも,人間のエージェントの正確な推定を行うことが示されたが,この手法は人間の遊びの行動的側面を考慮した手法とは比較されていない。
本稿では,この目的のために行動経済学の平衡概念を活用し,量的後悔法やナッシュ均衡法と比較して,それらがいかにうまく機能するかを問う。
正規形ゲームにおける観察データから人間のエージェントの効用を推定するために,確立された行動平衡モデルに基づく4つの推定法を開発した。
私たちが研究する平衡モデルは、量子応答平衡、アクションサンプリング平衡、ペイオフサンプリング平衡、インパルスバランス平衡である。
これらの概念のいくつかでは、推論は閉公式によって解析的に達成され、他方では、推論はアルゴリズム的にのみ達成されることを示す。
2x2ゲームの実験データを用いて,これらの行動平衡法の推定成功を評価する。
結果は、それらの推定値がナッシュ均衡の推定値よりも正確なことを示している。
quantal-regret法との比較により,行動法の方がヒット率が高いが,quantal-regret法の方が全体の平均二乗誤差の点で優れており,本手法の違いについて考察する。
関連論文リスト
- Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.57122943187086]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。
ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。
提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文 参考訳(メタデータ) (2024-07-02T03:31:21Z) - Human Trajectory Forecasting with Explainable Behavioral Uncertainty [63.62824628085961]
人間の軌道予測は人間の行動を理解し予測し、社会ロボットから自動運転車への応用を可能にする。
モデルフリー手法は予測精度が優れているが説明可能性に欠ける一方、モデルベース手法は説明可能性を提供するが、よく予測できない。
BNSP-SFMは,11種類の最先端手法と比較して,予測精度を最大50%向上することを示す。
論文 参考訳(メタデータ) (2023-07-04T16:45:21Z) - To update or not to update? Neurons at equilibrium in deep models [8.72305226979945]
近年の深層学習の進歩は, 完全学習モデルにおけるアポテリオリ情報によって, パラメータのサブセットを単に訓練することで, 同一の性能に適合できることを示した。
本研究では、単一パラメータからニューロン全体の挙動に焦点を移し、ニューロン平衡(NEq)の概念を活用する。
提案手法は、NEqを検証し、神経平衡が特定の学習設定に依存することを観察し、様々な最先端の学習戦略とタスクで検証されている。
論文 参考訳(メタデータ) (2022-07-19T08:07:53Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards
Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。
正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。
人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文 参考訳(メタデータ) (2022-01-27T22:15:56Z) - Can a single neuron learn predictive uncertainty? [0.0]
本稿では,一自由度を持つ最も単純なニューラルネットワークアーキテクチャ(単一ニューロン)に基づく,連続確率変数に対する新しい非パラメトリック量子化推定手法を提案する。
実世界の応用では、この手法は分割共形予測設定の下で予測の不確かさの定量化に利用できる。
論文 参考訳(メタデータ) (2021-06-07T15:12:47Z) - Counterfactual Representation Learning with Balancing Weights [74.67296491574318]
観察データによる因果推論の鍵は、それぞれの治療タイプに関連する予測的特徴のバランスを達成することである。
近年の文献では、この目標を達成するために表現学習を探求している。
因果効果を柔軟かつスケーラブルかつ正確に推定するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-10-23T19:06:03Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。