論文の概要: FinFlowRL: An Imitation-Reinforcement Learning Framework for Adaptive Stochastic Control in Finance
- arxiv url: http://arxiv.org/abs/2510.15883v1
- Date: Sat, 30 Aug 2025 02:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.073976
- Title: FinFlowRL: An Imitation-Reinforcement Learning Framework for Adaptive Stochastic Control in Finance
- Title(参考訳): FinFlowRL:金融における適応確率制御のための模倣強化学習フレームワーク
- Authors: Yang Li, Zhi Chen,
- Abstract要約: FinFlowRLは、金融最適制御のための新しいフレームワークである。
複数の専門家戦略からアダプティブなメタポリシーを事前学習する。
ノイズ空間における強化学習を微調整し、生成過程を最適化する。
- 参考スコア(独自算出の注目度): 5.43758668654755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional stochastic control methods in finance struggle in real world markets due to their reliance on simplifying assumptions and stylized frameworks. Such methods typically perform well in specific, well defined environments but yield suboptimal results in changed, non stationary ones. We introduce FinFlowRL, a novel framework for financial optimal stochastic control. The framework pretrains an adaptive meta policy learning from multiple expert strategies, then finetunes through reinforcement learning in the noise space to optimize the generative process. By employing action chunking generating action sequences rather than single decisions, it addresses the non Markovian nature of markets. FinFlowRL consistently outperforms individually optimized experts across diverse market conditions.
- Abstract(参考訳): 金融市場における従来の確率的制御手法は、仮定やスタイル化されたフレームワークの簡素化に依存しているため、現実の市場において苦戦している。
このような方法は通常、特定の、よく定義された環境でうまく機能するが、変化した非定常な環境では、最適以下の結果が得られる。
金融最適確率制御のための新しいフレームワークFinFlowRLを紹介する。
このフレームワークは、複数の専門家戦略から適応的なメタポリシー学習を事前訓練し、その後、ノイズ空間における強化学習を通じて微調整を行い、生成過程を最適化する。
単一決定ではなくアクションシーケンスを生成するアクションチャンキングを利用することで、市場のマルコフ的ではない性質に対処する。
FinFlowRLは、さまざまな市場の状況において、個別に最適化された専門家よりも一貫して優れています。
関連論文リスト
- FlowOE: Imitation Learning with Flow Policy from Ensemble RL Experts for Optimal Execution under Heston Volatility and Concave Market Impacts [11.523583937607622]
FlowOEはフローマッチングモデルに基づく新しい模倣学習フレームワークである。
FlowOEはさまざまな専門家の戦略から学び、市場状況に適応的に最も適した専門家の行動を選択する。
論文 参考訳(メタデータ) (2025-06-06T05:28:22Z) - Cross-Modal Temporal Fusion for Financial Market Forecasting [3.0756278306759635]
我々は、市場予測を改善するために、構造化および非構造化の財務データを融合するトランスフォーマーベースのディープラーニングフレームワークであるCross-Modal Temporal Fusion (CMTF)を導入する。
FTSE 100 ストックデータを用いた実験結果から,CMTF は古典的および深層学習ベースラインと比較して,価格方向分類において優れた性能を示した。
論文 参考訳(メタデータ) (2025-04-18T07:20:18Z) - FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文 参考訳(メタデータ) (2025-02-26T05:19:16Z) - Demystifying Domain-adaptive Post-training for Financial LLMs [87.28855088465197]
FINDAPは、大規模言語モデルのドメイン適応後トレーニングに関する体系的できめ細かな研究である。
このアプローチは、FinCap、FinRec、FinTrain、FinEvalの4つの重要なコンポーネントで構成されています。
結果として得られるモデルであるLlama-Finは、幅広い財務タスクにわたる最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-01-09T04:26:15Z) - The AI Black-Scholes: Finance-Informed Neural Network [11.339331636751329]
オプションの価格設定では、既存のモデルは原則駆動の手法とデータ駆動のアプローチに分類される。
対照的に、データ駆動モデルは市場データのトレンドを捉えるのに優れています。
本研究は、原理的手法とデータ駆動手法の両方の長所を統合することによって、これらの制限に対処するハイブリッドアプローチを提案する。
論文 参考訳(メタデータ) (2024-12-15T22:40:40Z) - Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。
本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-01-28T05:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。