論文の概要: Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets
- arxiv url: http://arxiv.org/abs/2510.19950v1
- Date: Wed, 22 Oct 2025 18:22:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.629961
- Title: Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets
- Title(参考訳): 金融におけるロバスト強化学習:楕円型不確実性セットによる市場インパクトのモデル化
- Authors: Shaocong Ma, Heng Huang,
- Abstract要約: 金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。
展開中、これらのエージェントは、自身の取引が資産価格を変えることができるライブマーケットで取引する。
従来のロバストなRLアプローチは、不確実性の集合に対して最悪のパフォーマンスを最適化することで、このモデルの誤特定に対処する。
楕円型不確実性集合の新たなクラスを開発し,効率的かつ堅牢な政策評価を可能にする。
- 参考スコア(独自算出の注目度): 57.179679246370114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In financial applications, reinforcement learning (RL) agents are commonly trained on historical data, where their actions do not influence prices. However, during deployment, these agents trade in live markets where their own transactions can shift asset prices, a phenomenon known as market impact. This mismatch between training and deployment environments can significantly degrade performance. Traditional robust RL approaches address this model misspecification by optimizing the worst-case performance over a set of uncertainties, but typically rely on symmetric structures that fail to capture the directional nature of market impact. To address this issue, we develop a novel class of elliptic uncertainty sets. We establish both implicit and explicit closed-form solutions for the worst-case uncertainty under these sets, enabling efficient and tractable robust policy evaluation. Experiments on single-asset and multi-asset trading tasks demonstrate that our method achieves superior Sharpe ratio and remains robust under increasing trade volumes, offering a more faithful and scalable approach to RL in financial markets.
- Abstract(参考訳): 金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。
しかし、配備中、これらのエージェントは、自身の取引が資産価格をシフトできるライブマーケットで取引する。
このトレーニング環境とデプロイメント環境のミスマッチは、パフォーマンスを著しく低下させる可能性がある。
従来のロバストなRLアプローチは、不確実性の集合に対して最悪のケースのパフォーマンスを最適化することで、このモデルの誤特定に対処するが、通常、市場への影響の方向性を捉えるのに失敗する対称構造に依存している。
この問題に対処するため、楕円型不確実集合の新しいクラスを開発する。
これらの集合における最悪のケースの不確実性に対して、暗黙的および明示的なクローズドフォームのソリューションを確立することにより、効率的かつトラクタブルなロバストなポリシー評価を可能にする。
単一アセスメントおよびマルチアセスメントトレーディングタスクの実験では、我々の手法はシャープ比が優れ、貿易量の増加の下では頑健であり、金融市場におけるRLに対するより忠実でスケーラブルなアプローチを提供する。
関連論文リスト
- Your AI, Not Your View: The Bias of LLMs in Investment Analysis [62.388554963415906]
金融において、Large Language Models (LLMs) は、事前訓練されたパラメトリック知識とリアルタイム市場データとの相違から生じる、頻繁な知識紛争に直面している。
これらの対立は、モデル固有のバイアスが制度的目的と誤認される現実世界の投資サービスにおいて特に問題となる。
本研究では,このような紛争シナリオにおける創発的行動を調べるための実験的枠組みを提案し,投資分析におけるバイアスの定量的分析を行う。
論文 参考訳(メタデータ) (2025-07-28T16:09:38Z) - Your Offline Policy is Not Trustworthy: Bilevel Reinforcement Learning for Sequential Portfolio Optimization [82.03139922490796]
強化学習(Reinforcement Learning, RL)は、過去のデータを用いたリスクを最小限にしつつ累積リターンを最大化することを目的とした、株式取引のような逐次的ポートフォリオ最適化タスクにおいて、大きな可能性を示してきた。
従来のRLアプローチは、固定データセット内での振る舞いの購入と販売を最適に記憶するだけのポリシーを生成することが多い。
当社のアプローチでは,ポートフォリオ最適化を新たなタイプの部分オフラインRL問題として捉え,2つの技術的貢献を行う。
論文 参考訳(メタデータ) (2025-05-19T06:37:25Z) - When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - Deep Hedging with Market Impact [0.20482269513546458]
本稿では,Deep Reinforcement Learning(DRL)に基づく新しい市場インパクト動的ヘッジモデルを提案する。
DRLモデルから得られた最適ポリシーは、いくつかのオプションヘッジシミュレーションを用いて分析され、デルタヘッジのような一般的な手順と比較される。
論文 参考訳(メタデータ) (2024-02-20T19:08:24Z) - ROI Constrained Bidding via Curriculum-Guided Bayesian Reinforcement
Learning [34.82004227655201]
非定常市場におけるROI制約入札を専門とする。
部分観測可能な制約付きマルコフ決定プロセスに基づいて,非単調な制約を満たすための最初のハードバリアソリューションを提案する。
本手法は,パラメータフリーなインジケータ強化報酬関数を利用して,カリキュラムガイドベイズ強化学習フレームワークを開発する。
論文 参考訳(メタデータ) (2022-06-10T17:30:12Z) - Empirical Study of Market Impact Conditional on Order-Flow Imbalance [0.0]
署名された注文フローに対して,注文フローの不均衡の増加に伴い,価格への影響は線形に増大することを示す。
さらに,注文フローにサインされた市場への影響を予測するために,機械学習アルゴリズムを実装した。
この結果から,機械学習モデルを用いて財務変数を推定できることが示唆された。
論文 参考訳(メタデータ) (2020-04-17T14:58:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。