論文の概要: Deep Reinforcement Learning Framework for Diversified Portfolio Management Across Global Equity Markets
- arxiv url: http://arxiv.org/abs/2605.17307v1
- Date: Sun, 17 May 2026 07:50:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.892584
- Title: Deep Reinforcement Learning Framework for Diversified Portfolio Management Across Global Equity Markets
- Title(参考訳): グローバル・エクイティ・マーケットにおける多様なポートフォリオ・マネジメントのための深層強化学習フレームワーク
- Authors: Kamil Kashif, Robert Ślepaczuk,
- Abstract要約: 本研究は,グローバル・エクイティ・マーケットにおける動的ポートフォリオ・アロケーションのための深層強化学習フレームワークを開発し,評価する。
報酬の定式化、政策構造、ポートフォリオ制約、時間エンコーダの5つのモデル構成を比較する。
その結果、RL戦略は、統計学的に有意な異常リターンが観測されるEuro Stoxx 50において、主に競争リスク調整性能を達成することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This study develops and evaluates a deep reinforcement learning framework for dynamic portfolio allocation across global equity markets. The Soft Actor-Critic algorithm is used to learn continuous portfolio weights within a Markov Decision Process, incorporating transaction costs, turnover penalties, and diversification constraints into the reward function. Five model configurations are compared, varying in reward formulation, policy structure (flat versus hierarchical Dirichlet), portfolio constraints, and temporal encoder (LSTM versus Transformer), and evaluated via walk-forward optimization across sixteen out-of-sample folds spanning 2003-2026 on the Nasdaq-100, Nikkei 225, and Euro Stoxx 50. Results show that RL strategies achieve competitive risk-adjusted performance primarily in the Euro Stoxx 50, where statistically significant abnormal returns are observed, but the central hypothesis is only partially confirmed: no strategy achieves statistically significant excess returns relative to Buy and Hold under HAC-robust inference across all markets. Regime analysis reveals that RL adds the most value during periods of elevated uncertainty, while ensemble aggregation across markets improves risk-adjusted performance and confirms the benefits of geographic diversification.
- Abstract(参考訳): 本研究は,グローバル・エクイティ・マーケットにおける動的ポートフォリオ・アロケーションのための深層強化学習フレームワークを開発し,評価する。
ソフトアクター・クライブアルゴリズムは、マルコフ決定プロセス内での継続的なポートフォリオの重み付けを学習するために使用され、トランザクションコスト、ターンオーバーペナルティ、および多角化制約を報酬関数に組み込む。
5つのモデル構成を比較し、報酬の定式化、政策構造(フラット対階層ディリクレ)、ポートフォリオ制約、時間エンコーダ(LSTM対トランスフォーマー)を比較し、2003-2026年のナスダック100、日経225、ユーロストックス50の16個のアウト・オブ・サンブル・フォールドのウォークフォワード最適化によって評価した。
その結果、RL戦略は、統計学的に有意な異常リターンが観測されるユーロ・ストックス50において、主に競争リスク調整性能を達成するが、中央仮説は部分的にのみ確認されている。
レジーム分析によると、RLは高い不確実性の期間に最も価値を増す一方、市場全体でのアンサンブルアグリゲーションはリスク調整性能を改善し、地理的多様化の利点を確認する。
関連論文リスト
- Experience Sharing in Mutual Reinforcement Learning for Heterogeneous Language Models [48.79781352398832]
我々は,相互強化学習(Multual Reinforcement Learning)を紹介した。
このフレームワークは、共有エクスペリエンス交換(SEE)、マルチワークリソース割り当て(MWRA)、およびTokenizer Heterogeneity Layer(THL)を組み合わせる。
GRPO上の3つの制御されたプローブをインスタンス化する: Peer Rollout Pooling (PRP)によるデータレベルのロールアウト共有、Cross-Policy GRPO Advantage Sharing (XGRPO)による価値レベルのアドバンテージ共有、Success-Gated Transfer (SGT)による結果レベルの成功転送。
論文 参考訳(メタデータ) (2026-05-08T05:01:40Z) - Taming the Black Swan: A Momentum-Gated Hierarchical Optimisation Framework for Asymmetric Alpha Generation [0.0]
本研究は,成長と安定のトレードオフを再設計する新しい枠組みであるアダプティブ・エクイティ・ジェネレーション・アンド・免疫システム(AEGIS)を提案する。
ボラティリティ調整運動量フィルタを用いてトレンド強度を同定し、最小相関アルゴリズムを用いて構造的多様化を強制する。
2008年のGlobal Financial Crisisのような重要なストレスイベントをカバーする総合的な20年間のウォーキングフォワードバックテスト(2006-2025)による実証検証は、このフレームワークが標準のS&P 500ベンチマークと比較してかなり過剰なアルファを生成することを確認している。
論文 参考訳(メタデータ) (2026-04-10T07:39:27Z) - DVPO: Distributional Value Modeling-based Policy Optimization for LLM Post-Training [45.777138699734024]
本稿では、条件付きリスク理論と分布値モデリングを組み合わせた新しいRLフレームワークであるDVPOを紹介し、ロバスト性と一般化のバランスを改善する。
DVPOはPPO、GRPO、ロバストなベルマンベースのPPOを常に上回っている。
論文 参考訳(メタデータ) (2025-12-03T14:48:38Z) - Statistical Arbitrage in Polish Equities Market Using Deep Learning Techniques [0.0]
我々は,一般的な統計アービタージュ手法であるペアズ・トレーディング(Pairs Trading)の体系的アプローチについて検討した。
第2の資産をリスクファクター表現を使用した第1の複製に置き換える。
Avellaneda と Lee (2008) の枠組みをポーランド市場に適用する。
論文 参考訳(メタデータ) (2025-11-20T21:09:34Z) - Cryptocurrency Portfolio Management with Reinforcement Learning: Soft Actor--Critic and Deep Deterministic Policy Gradient Algorithms [0.0]
本稿では,暗号通貨ポートフォリオ管理のための強化学習ベースのフレームワークを提案する。
我々は,Soft Actor-Critic(SAC)アルゴリズムとDeep Deterministic Policy Gradient(DDPG)アルゴリズムを用いる。
論文 参考訳(メタデータ) (2025-11-16T03:43:24Z) - Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets [57.179679246370114]
金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。
展開中、これらのエージェントは、自身の取引が資産価格を変えることができるライブマーケットで取引する。
従来のロバストなRLアプローチは、不確実性の集合に対して最悪のパフォーマンスを最適化することで、このモデルの誤特定に対処する。
楕円型不確実性集合の新たなクラスを開発し,効率的かつ堅牢な政策評価を可能にする。
論文 参考訳(メタデータ) (2025-10-22T18:22:25Z) - Building crypto portfolios with agentic AI [46.348283638884425]
暗号通貨市場の急速な成長は投資家に新たな機会を与えたが、同時に高いボラティリティがもたらされた。
本稿では,暗号アロケーションを自律的に構築し,評価するためのマルチエージェントシステムの実用化について述べる。
論文 参考訳(メタデータ) (2025-07-11T18:03:51Z) - Deep Learning Enhanced Multi-Day Turnover Quantitative Trading Algorithm for Chinese A-Share Market [0.0]
アルゴリズムは2010-2020年の総合的なAシェアデータに基づいて訓練され、2021-2024のデータに対して厳格に検証されている。
15.2%の年次リターン、5%未満の最大降格、シャープ比1.87で顕著なパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-06-03T01:59:55Z) - MTS: A Deep Reinforcement Learning Portfolio Management Framework with Time-Awareness and Short-Selling [0.8642326601683299]
本稿では,時間認識と短時間販売を伴うDeep Reinforcement Learning Portfolio Management Frameworkを紹介する。
動的リスク管理の限界、時間的市場の利用、短期販売のような複雑な取引戦略の導入に対処する。
シャープ、オメガ、ソルティーノ比の累積リターンを継続的に達成し、リスクとリターンのバランスをとる効果を裏付ける。
論文 参考訳(メタデータ) (2025-03-06T06:41:17Z) - Deep Reinforcement Learning and Mean-Variance Strategies for Responsible Portfolio Optimization [49.396692286192206]
本研究では,ESG状態と目的を取り入れたポートフォリオ最適化のための深層強化学習について検討する。
以上の結果から,ポートフォリオアロケーションに対する平均分散アプローチに対して,深層強化学習政策が競争力を発揮する可能性が示唆された。
論文 参考訳(メタデータ) (2024-03-25T12:04:03Z) - Reinforcement-Learning based Portfolio Management with Augmented Asset
Movement Prediction States [71.54651874063865]
ポートフォリオマネジメント(PM)は、最大利益や最小リスクといった投資目標を達成することを目的としている。
本稿では,PMのための新しいステート拡張RLフレームワークであるSARLを提案する。
当社の枠組みは, 金融PMにおける2つのユニークな課題に対処することを目的としている。(1) データの異種データ -- 資産毎の収集情報は通常, 多様性, ノイズ, 不均衡(ニュース記事など), (2) 環境の不確実性 -- 金融市場は多様で非定常である。
論文 参考訳(メタデータ) (2020-02-09T08:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。