論文の概要: A maximum entropy model of bounded rational decision-making with prior
beliefs and market feedback
- arxiv url: http://arxiv.org/abs/2102.09180v1
- Date: Thu, 18 Feb 2021 06:41:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:10:46.015782
- Title: A maximum entropy model of bounded rational decision-making with prior
beliefs and market feedback
- Title(参考訳): 事前の信念と市場フィードバックによる有界合理的意思決定の最大エントロピーモデル
- Authors: Benjamin Patrick Evans, Mikhail Prokopenko
- Abstract要約: スミソニアン競争におけるエージェント決定の推論に対する情報理論的アプローチを提案する。
このモデルは、事前の信念を拡大するための情報獲得のコストとしてエージェントの限定性を明確に捉えている。
オーストラリアの住宅市場データを用いて提案モデルを確認し,先行知識の組み入れがエージェントの決定をどう変えるかを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bounded rationality is an important consideration stemming from the fact that
agents often have limits on their processing abilities, making the assumption
of perfect rationality inapplicable to many real tasks. We propose an
information-theoretic approach to the inference of agent decisions under
Smithian competition. The model explicitly captures the boundedness of agents
(limited in their information-processing capacity) as the cost of information
acquisition for expanding their prior beliefs. The expansion is measured as the
Kullblack-Leibler divergence between posterior decisions and prior beliefs.
When information acquisition is free, the \textit{homo economicus} agent is
recovered, while in cases when information acquisition becomes costly, agents
instead revert to their prior beliefs. The maximum entropy principle is used to
infer least-biased decisions, based upon the notion of Smithian competition
formalised within the Quantal Response Statistical Equilibrium framework. The
incorporation of prior beliefs into such a framework allowed us to
systematically explore the effects of prior beliefs on decision-making, in the
presence of market feedback. We verified the proposed model using Australian
housing market data, showing how the incorporation of prior knowledge alters
the resulting agent decisions. Specifically, it allowed for the separation (and
analysis) of past beliefs and utility maximisation behaviour of the agent.
- Abstract(参考訳): 境界有理性は、エージェントが処理能力に制限を課すことがしばしばあり、多くの実タスクに完全有理性の仮定が適用できないという事実から生じる重要な考察である。
スミソニアン競争におけるエージェント決定の推論に対する情報理論的アプローチを提案する。
このモデルは、エージェントの境界性(情報処理能力に制限がある)を、以前の信念を拡張するための情報取得のコストとして明示的に捉えている。
拡張は、後方決定と以前の信念の間のKal Black-Leiblerの分岐として測定される。
情報取得が無料の場合、 \textit{homo economyus} エージェントが回収されますが、情報取得が高価になった場合、エージェントは代わりに以前の信念に戻ります。
最大エントロピー原理は、量子応答統計平衡フレームワーク内で形式化されたスミディアン競争の概念に基づいて、最小偏りの決定を推測するために使用されます。
このような枠組みに先着的信念を組み込むことにより、市場フィードバックの存在下で、先着的信念が意思決定に与える影響を体系的に検討することができました。
オーストラリアの住宅市場データを用いて提案モデルを確認し,先行知識の組み入れがエージェントの決定をどう変えるかを示した。
具体的には、過去の信念とエージェントの実用的最大化行動の分離(および分析)を可能にした。
関連論文リスト
- Language Models Can Reduce Asymmetry in Information Markets [100.38786498942702]
我々は、言語モデルを利用した知的エージェントが外部参加者に代わって情報を売買する、オープンソースのシミュレートされたデジタルマーケットプレースを紹介した。
このマーケットプレースを実現する中心的なメカニズムはエージェントの二重機能であり、特権情報の品質を評価する能力を持つと同時に、忘れる能力も備えている。
適切に行動するためには、エージェントは合理的な判断をし、生成されたサブクエリを通じて市場を戦略的に探索し、購入した情報から回答を合成する必要がある。
論文 参考訳(メタデータ) (2024-03-21T14:48:37Z) - Efficient Non-Parametric Uncertainty Quantification for Black-Box Large
Language Models and Decision Planning [17.752461521448236]
本稿では,不確実性を考慮した意思決定計画に焦点をあて,言語モデルにおける問題に対処する。
我々の不確実性評価と意思決定エージェント設計は、AIエージェント開発にコスト効率のよいアプローチを提供する。
論文 参考訳(メタデータ) (2024-02-01T00:23:31Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - Estimating and Incentivizing Imperfect-Knowledge Agents with Hidden
Rewards [4.742123770879715]
実際には、インセンティブ提供者はインセンティブ付きエージェントの報酬実現を観察できないことが多い。
本稿では,自己関心学習エージェントと学習プリンシパルの繰り返し選択ゲームについて検討する。
我々は,プリンシパルのインセンティブとエージェントの選択履歴のみを入力とする推定器を導入する。
論文 参考訳(メタデータ) (2023-08-13T08:12:01Z) - On Imperfect Recall in Multi-Agent Influence Diagrams [57.21088266396761]
マルチエージェント・インフルエンス・ダイアグラム(MAID)はベイズネットワークに基づくゲーム理論モデルとして人気がある。
混合ポリシと2種類の相関平衡を用いて, 忘れ易いエージェントと不注意なエージェントでMAIDを解く方法を示す。
また,不完全なリコールがしばしば避けられないマルコフゲームやチーム状況へのMAIDの適用についても述べる。
論文 参考訳(メタデータ) (2023-07-11T07:08:34Z) - Application of Causal Inference to Analytical Customer Relationship
Management in Banking and Insurance [6.228766191647919]
統計学において、因果関係は長年研究され、応用されてきたが、人工知能(AI)についてはあまり詳細には研究されていない。
本研究では、分析的顧客関係管理問題を解決するための説明可能性を提供するために、因果推論の原則を適用した。
ローンのデフォルト、保険詐欺検出、クレジットカード詐欺検出データセットの良質な対策が作成された。
論文 参考訳(メタデータ) (2022-08-19T05:57:58Z) - Causal Fairness Analysis [68.12191782657437]
意思決定設定における公平性の問題を理解し、モデル化し、潜在的に解決するためのフレームワークを導入します。
我々のアプローチの主な洞察は、観測データに存在する格差の定量化と、基礎となる、しばしば観測されていない、因果的なメカニズムの収集を結びつけることである。
本研究は,文献中の異なる基準間の関係を整理し,説明するための最初の体系的試みであるフェアネスマップにおいて,本研究の成果を左右するものである。
論文 参考訳(メタデータ) (2022-07-23T01:06:34Z) - Bounded rationality for relaxing best response and mutual consistency:
An information-theoretic model of partial self-reference [0.0]
この研究は、相互整合性やベストレスポンスなど、合理的性の前提となるいくつかの仮定に焦点を当てている。
我々は、レベル-$k$推論と量子応答平衡(QRE)の概念を用いて、これらの仮定を緩和する方法を検討する。
論文 参考訳(メタデータ) (2021-06-30T06:56:56Z) - Alternative Microfoundations for Strategic Classification [33.67797984699066]
完全な情報を持つ合理的なエージェントは、決定規則に対する集合的応答において不連続を生じさせることを示す。
標準的なマイクロファウンデーションの下での最適決定ルールは、社会的負担として知られる負の外部性の尺度を最大化する。
我々のモデルは、分析的トラクタビリティを保持し、安定点に関するより堅牢な洞察をもたらし、最適性において社会的負担を低くする。
論文 参考訳(メタデータ) (2021-06-24T00:30:58Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。