論文の概要: Quantum Reinforcement Learning Trading Agent for Sector Rotation in the Taiwan Stock Market
- arxiv url: http://arxiv.org/abs/2506.20930v1
- Date: Thu, 26 Jun 2025 01:29:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.937276
- Title: Quantum Reinforcement Learning Trading Agent for Sector Rotation in the Taiwan Stock Market
- Title(参考訳): 台湾株式市場におけるセクターローテーションのための量子強化学習エージェント
- Authors: Chi-Sheng Chen, Xinyu Zhang, Ya-Chuan Chen,
- Abstract要約: 台湾株式市場におけるセクターローテーションのためのハイブリッド量子古典的強化学習フレームワークを提案する。
量子強化モデルは、常により高いトレーニング報酬を達成するが、それらは現実世界の投資指標において古典的なモデルより劣る。
この不一致は、金融分野に強化学習を適用する上での課題を浮き彫りにしている。
- 参考スコア(独自算出の注目度): 7.360168388085351
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a hybrid quantum-classical reinforcement learning framework for sector rotation in the Taiwan stock market. Our system employs Proximal Policy Optimization (PPO) as the backbone algorithm and integrates both classical architectures (LSTM, Transformer) and quantum-enhanced models (QNN, QRWKV, QASA) as policy and value networks. An automated feature engineering pipeline extracts financial indicators from capital share data to ensure consistent model input across all configurations. Empirical backtesting reveals a key finding: although quantum-enhanced models consistently achieve higher training rewards, they underperform classical models in real-world investment metrics such as cumulative return and Sharpe ratio. This discrepancy highlights a core challenge in applying reinforcement learning to financial domains -- namely, the mismatch between proxy reward signals and true investment objectives. Our analysis suggests that current reward designs may incentivize overfitting to short-term volatility rather than optimizing risk-adjusted returns. This issue is compounded by the inherent expressiveness and optimization instability of quantum circuits under Noisy Intermediate-Scale Quantum (NISQ) constraints. We discuss the implications of this reward-performance gap and propose directions for future improvement, including reward shaping, model regularization, and validation-based early stopping. Our work offers a reproducible benchmark and critical insights into the practical challenges of deploying quantum reinforcement learning in real-world finance.
- Abstract(参考訳): 台湾株式市場におけるセクターローテーションのためのハイブリッド量子古典的強化学習フレームワークを提案する。
本システムでは,バックボーンアルゴリズムとしてPPOを採用し,古典的アーキテクチャ(LSTM, Transformer)と量子拡張モデル(QNN, QRWKV, QASA)をポリシとバリューネットワークとして統合する。
自動機能エンジニアリングパイプラインは、資本共有データから財務指標を抽出し、すべての構成にわたって一貫したモデル入力を保証する。
量子化されたモデルは、常により高いトレーニング報酬を達成するが、累積リターンやシャープ比のような実世界の投資指標において古典的なモデルよりも性能が低い。
この不一致は、強化学習を金融分野に適用する上でのコア課題、すなわち、プロキシ報酬信号と真の投資目標とのミスマッチを浮き彫りにしている。
我々の分析は、現在の報酬設計がリスク調整されたリターンを最適化するのではなく、短期的なボラティリティに過度に適合する可能性があることを示唆している。
この問題は、ノイズ中間スケール量子(NISQ)制約下での量子回路の固有表現性と最適化不安定性によって合成される。
この報奨効果ギャップがもたらす意味について議論し、報奨形成、モデル正規化、検証に基づく早期停止など、今後の改善に向けた方向性を提案する。
我々の研究は再現可能なベンチマークと、現実の金融に量子強化学習を展開させる実践的課題に対する重要な洞察を提供する。
関連論文リスト
- Intra-Trajectory Consistency for Reward Modeling [67.84522106537274]
軌道内整合性正則化を開発し、より高い次トーケン生成確率を持つプロセスがより一貫した報酬を維持することを強制する。
提案した正規化でトレーニングした報酬モデルにより、より優れたDPO整合ポリシーが導出され、より優れたベスト・オブ・N(BON)検証結果が得られることを示す。
論文 参考訳(メタデータ) (2025-06-10T12:59:14Z) - End-to-End Portfolio Optimization with Quantum Annealing [0.48516757555267037]
この研究は、ハイブリッド量子古典モデルを用いて、古典的手法よりも複雑な最適化を効果的に扱えるように組み合わせたアプローチを示している。
実証的な結果は、このベンチマークで20万のインドルーペのポートフォリオが増加したことを示している。
論文 参考訳(メタデータ) (2025-04-10T21:31:30Z) - HQNN-FSP: A Hybrid Classical-Quantum Neural Network for Regression-Based Financial Stock Market Prediction [3.5418331252013897]
本研究では、金融トレンド予測を支援するためのハイブリッド量子古典的アプローチの可能性について検討する。
独自の量子ニューラルネットワーク(QNN)レグレシタが導入された。
論文 参考訳(メタデータ) (2025-03-19T16:44:21Z) - LEP-QNN: Loan Eligibility Prediction Using Quantum Neural Networks [4.2435928520499635]
我々は、量子ニューラルネットワーク(LEP-QNN)を用いたローン適性予測に量子機械学習(QML)を用いる新しいアプローチを提案する。
私たちの革新的なアプローチは、単一の包括的なデータセットからローンの適格性を98%の精度で予測します。
本研究は、金融予測におけるQMLの可能性を示し、QML技術の進歩のための基礎的なガイドを確立する。
論文 参考訳(メタデータ) (2024-12-04T09:35:03Z) - BreakGPT: Leveraging Large Language Models for Predicting Asset Price Surges [55.2480439325792]
本稿では,時系列予測や資産価格の急上昇の予測に特化して,新たな大規模言語モデル(LLM)アーキテクチャであるBreakGPTを紹介する。
我々は、最小限のトレーニングで財務予測を行うための有望なソリューションとしてBreakGPTを紹介し、局所的およびグローバルな時間的依存関係をキャプチャする強力な競合相手として紹介する。
論文 参考訳(メタデータ) (2024-11-09T05:40:32Z) - VinePPO: Refining Credit Assignment in RL Training of LLMs [66.80143024475635]
我々は,言語環境の柔軟性を利用してモンテカルロをベースとした推定値を計算する,簡単なアプローチであるVinePPOを提案する。
本手法は,MATHおよびGSM8Kデータセット間のPPOおよび他のベースラインをウォールクロック時間以下で連続的に上回る。
論文 参考訳(メタデータ) (2024-10-02T15:49:30Z) - QADQN: Quantum Attention Deep Q-Network for Financial Market Prediction [6.3671741591443105]
本稿では量子注意深度Q-Network(QADQN)アプローチを導入し,量子強化学習を通じてこれらの課題に対処する。
我々は、S&P500を含む主要市場指標の履歴データに基づいて、QADQNエージェントのパフォーマンスを評価する。
我々の実証結果はQADQNの優れた性能を示し、より優れたリスク調整リターンを実現した。
論文 参考訳(メタデータ) (2024-08-06T10:41:46Z) - Dynamic Asset Allocation with Expected Shortfall via Quantum Annealing [0.0]
本稿では,動的アセット割り当て問題を解決するために,ハイブリッド量子古典アルゴリズムを提案する。
D-Waveの2000QとAdvantageの量子アニールの結果を実世界の財務データを用いて比較する。
高い相関関係を持つ資産の実験は、より優れた性能を発揮する傾向にあり、近い将来、実用的な量子アプリケーションを設計するのに役立つかもしれない。
論文 参考訳(メタデータ) (2021-12-06T17:39:43Z) - Model-Augmented Q-learning [112.86795579978802]
モデルベースRLの構成要素を付加したMFRLフレームワークを提案する。
具体的には、$Q$-valuesだけでなく、共有ネットワークにおける遷移と報酬の両方を見積もる。
提案手法は,MQL (Model-augmented $Q$-learning) とよばれる提案手法により,真に報いられた学習によって得られる解と同一のポリシ不変解が得られることを示す。
論文 参考訳(メタデータ) (2021-02-07T17:56:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。