論文の概要: Model-Free Inference of Investor Preferences: A Relative Entropy IRL Approach
- arxiv url: http://arxiv.org/abs/2604.24280v1
- Date: Mon, 27 Apr 2026 10:13:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.89116
- Title: Model-Free Inference of Investor Preferences: A Relative Entropy IRL Approach
- Title(参考訳): 投資家選好のモデルフリー推論:相対エントロピーIRLアプローチ
- Authors: Chen Xu,
- Abstract要約: 本稿では,Relative Entropy Inverse Reinforcement Learning (RE-IRL) を用いて,投資行動や市場状況から投資家報酬機能を回復する枠組みを提案する。
データ分散性の課題に対処するために、観測された行動ポリシーを推定するために、$K$-nearest の隣り合うアプローチを用いる。
- 参考スコア(独自算出の注目度): 5.737648067191245
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a framework using Relative Entropy Inverse Reinforcement Learning (RE-IRL) to recover investor reward functions from observed investment actions and market conditions. Unlike traditional IRL algorithms, RE-IRL is employed to account for environments where transition probabilities are unknown or inaccessible. To address the challenge of data sparsity, we utilize a $K$-nearest neighbor approach to estimate the observed behavior policy. Furthermore, we propose a statistical testing framework to evaluate the validity and robustness of the estimated results.
- Abstract(参考訳): 本稿では,Relative Entropy Inverse Reinforcement Learning (RE-IRL) を用いて,投資行動や市場状況から投資家報酬機能を回復する枠組みを提案する。
従来のIRLアルゴリズムとは異なり、RE-IRLは遷移確率が未知あるいは到達不能な環境を考慮に入れている。
データ分散性の課題に対処するために、観測された行動ポリシーを推定するために、$K$-nearest の隣り合うアプローチを用いる。
さらに,評価結果の妥当性とロバスト性を評価するための統計的テストフレームワークを提案する。
関連論文リスト
- Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - Improved Policy Evaluation for Randomized Trials of Algorithmic Resource
Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。
我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文 参考訳(メタデータ) (2023-02-06T05:17:22Z) - Latent State Marginalization as a Low-cost Approach for Improving
Exploration [79.12247903178934]
我々はMaxEntフレームワークにおける潜在変数ポリシーの採用を提案する。
我々は、潜在変数ポリシーが、潜在信念状態を持つ世界モデルの下で自然に現れることを示す。
提案手法を連続制御タスクに対して実験的に検証し, 有効限界化がよりよい探索とより堅牢な訓練につながることを示した。
論文 参考訳(メタデータ) (2022-10-03T15:09:12Z) - Active Exploration for Inverse Reinforcement Learning [58.295273181096036]
Inverse Reinforcement Learning (AceIRL) のための新しいIRLアルゴリズムを提案する。
AceIRLは、専門家の報酬関数を素早く学習し、良い政策を特定するために、未知の環境と専門家のポリシーを積極的に探求する。
我々はシミュレーションにおいてAceIRLを実証的に評価し、より単純な探索戦略よりも著しく優れていることを発見した。
論文 参考訳(メタデータ) (2022-07-18T14:45:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。