Fugu-MT 論文翻訳(概要): Dynamic Portfolio Optimization via Augmented DDPG with Quantum Price Levels-Based Trading Strategy

論文の概要: Dynamic Portfolio Optimization via Augmented DDPG with Quantum Price Levels-Based Trading Strategy

arxiv url: http://arxiv.org/abs/2501.08528v1
Date: Wed, 15 Jan 2025 02:37:28 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-16 16:46:28.332355
Title: Dynamic Portfolio Optimization via Augmented DDPG with Quantum Price Levels-Based Trading Strategy
Title（参考訳）: 量子価格レベルに基づく取引戦略を用いた拡張DDPGによる動的ポートフォリオ最適化
Authors: Runsheng Lin, Zihan Xing, Mingze Ma, Raymond S. T. Lee,
Abstract要約: DDPG(Deep Deterministic Policy Gradient)に基づくモデル固有の構造を改良し,拡張DDPGモデルを提案した。本モデルでは, DPO問題において, ベースラインモデルと比較して, リスク管理能力が向上し, サンプルの複雑さが低下する。
参考スコア（独自算出の注目度）: 1.7999333451993955
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the development of deep learning, Dynamic Portfolio Optimization (DPO) problem has received a lot of attention in recent years, not only in the field of finance but also in the field of deep learning. Some advanced research in recent years has proposed the application of Deep Reinforcement Learning (DRL) to the DPO problem, which demonstrated to be more advantageous than supervised learning in solving the DPO problem. However, there are still certain unsolved issues: 1) DRL algorithms usually have the problems of slow learning speed and high sample complexity, which is especially problematic when dealing with complex financial data. 2) researchers use DRL simply for the purpose of obtaining high returns, but pay little attention to the problem of risk control and trading strategy, which will affect the stability of model returns. In order to address these issues, in this study we revamped the intrinsic structure of the model based on the Deep Deterministic Policy Gradient (DDPG) and proposed the Augmented DDPG model. Besides, we also proposed an innovative risk control strategy based on Quantum Price Levels (QPLs) derived from Quantum Finance Theory (QFT). Our experimental results revealed that our model has better profitability as well as risk control ability with less sample complexity in the DPO problem compared to the baseline models.
Abstract（参考訳）: ディープラーニングの発展に伴い、動的ポートフォリオ最適化(DPO)問題は金融だけでなく、ディープラーニングの分野でも近年注目を集めている。近年の先進的な研究により、DPO問題への深層強化学習(DRL)の適用が提案されている。しかし、未解決の問題はまだある。 1)DRLアルゴリズムは通常、複雑な財務データを扱う場合に特に問題となる、遅い学習速度と高いサンプルの複雑さの問題がある。 2) 研究者は単に高いリターンを得るためにDRLを使用するが,リスクコントロールやトレーディング戦略の問題にはほとんど注意を払わず,モデルリターンの安定性に影響を及ぼす。これらの問題に対処するため,本研究では,Deep Deterministic Policy Gradient(DDPG)に基づくモデル固有の構造を改良し,拡張DDPGモデルを提案する。また、量子ファイナンス理論(QFT)に基づく量子価格レベル(QPL)に基づく革新的なリスク制御戦略も提案した。実験結果から,本モデルはDPO問題において,ベースラインモデルに比べてリスク管理能力が劣るとともに,収益性も良好であることがわかった。

関連論文リスト

Market Making Strategies with Reinforcement Learning [0.0]
市場メーカー(MM)は流動性の提供において基本的な役割を担っているが、在庫リスク、競争、非定常市場ダイナミクスから生じる重大な課題に直面している。本研究は, 自律的, 適応的, 収益的な市場形成戦略を開発するために, 強化学習をいかに活用できるかを考察する。
論文参考訳（メタデータ） (2025-07-24T16:17:49Z)
Perception-Aware Policy Optimization for Multimodal Reasoning [79.56070395437898]
現在のマルチモーダル推論における誤りの主な原因は、視覚入力の知覚にある。提案するPAPOは,モデルが推論を学習しながら知覚を学習することを奨励する,新しいポリシー勾配アルゴリズムである。知覚誤りの30.5%が有意に減少し,PAPOによる知覚能力の向上が示唆された。
論文参考訳（メタデータ） (2025-07-08T23:22:34Z)
On-Policy RL with Optimal Reward Baseline [109.47676554514193]
On-Policy RL with Optimal reward baseline (OPO) は、新しい簡易強化学習アルゴリズムである。 OPOは、訓練プロセスを実証的に安定化し、探索を強化する、正確なオンライントレーニングの重要性を強調している。その結果、OPOの優れた性能と訓練安定性を、追加のモデルや正規化条件なしで示すことができた。
論文参考訳（メタデータ） (2025-05-29T15:58:04Z)
Deep Reinforcement Learning Algorithms for Option Hedging [0.20482269513546458]
動的ヘッジの文脈における8つのDeep Reinforcement Learning (DRL)アルゴリズムの性能を比較した。 MCPGはブラック・スコイルズ・デルタ・ヘッジ・ベースラインを計算予算で上回る唯一のアルゴリズムである。
論文参考訳（メタデータ） (2025-04-07T21:32:14Z)
Risk-averse policies for natural gas futures trading using distributional reinforcement learning [0.0]
本稿では,天然ガス先物取引における3つの分散RLアルゴリズムの有効性について検討する。私たちの知る限りでは、これらのアルゴリズムはトレーディングの文脈で一度も適用されていない。 CVaR を最大化するために C51 と IQN を訓練すると, リスク回避性のあるリスク感受性ポリシーが得られた。
論文参考訳（メタデータ） (2025-01-08T11:11:25Z)
Hierarchical Preference Optimization: Learning to achieve goals via feasible subgoals prediction [71.81851971324187]
本研究は階層型強化学習(HRL)の新しいアプローチである階層型優先度最適化(HPO)を導入する。 HPOは、複雑なロボット制御タスクを解く際に、非定常性と非実用的なサブゴール生成の問題に対処する。挑戦的なロボットナビゲーションと操作タスクの実験はHPOの素晴らしいパフォーマンスを示しており、ベースラインよりも最大35%改善されている。
論文参考訳（メタデータ） (2024-11-01T04:58:40Z)
Deep Reinforcement Learning for Online Optimal Execution Strategies [49.1574468325115]
本稿では,動的な金融市場における非マルコフ的最適実行戦略の学習に挑戦する。我々は,Deep Deterministic Policy Gradient(DDPG)に基づく新しいアクター批判アルゴリズムを提案する。提案アルゴリズムは最適実行戦略の近似に成功していることを示す。
論文参考訳（メタデータ） (2024-10-17T12:38:08Z)
VinePPO: Unlocking RL Potential For LLM Reasoning Through Refined Credit Assignment [66.80143024475635]
VinePPOは不偏のモンテカルロ推定を計算するための簡単な手法である。我々は、VinePPOが、MATHおよびGSM8Kデータセット間でPPOや他のRLフリーベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (2024-10-02T15:49:30Z)
Explainable Post hoc Portfolio Management Financial Policy of a Deep Reinforcement Learning agent [44.99833362998488]
我々はポートフォリオ管理のための新しい説明可能な深層強化学習(XDRL)アプローチを開発した。方法論を実践することにより、エージェントの行動を予測する時間内に解釈し、投資政策の要件に従うかどうかを評価することができる。
論文参考訳（メタデータ） (2024-07-19T17:40:39Z)
Optimizing Portfolio Management and Risk Assessment in Digital Assets Using Deep Learning for Predictive Analysis [5.015409508372732]
本稿では,DQNアルゴリズムを新規かつ簡単な方法で資産管理ポートフォリオに導入する。この性能はベンチマークをはるかに上回り、ポートフォリオ管理におけるDRLアルゴリズムの有効性を十分に証明している。異なる資産は別々に環境として訓練されるので、異なる資産間でQ値が漂う現象があるかもしれない。
論文参考訳（メタデータ） (2024-02-25T05:23:57Z)
From Bandits Model to Deep Deterministic Policy Gradient, Reinforcement Learning with Contextual Information [4.42532447134568]
本研究では,文脈情報による問題を克服するために2つの手法を用いる。量的市場における戦略的トレーディングを検討するため、我々はCPPI(Constant proportion portfolio Insurance)と呼ばれる初期の金融トレーディング戦略をDDPG(Deep Deterministic Policy gradient)に統合した。実験の結果,両手法が強化学習の進行を加速し,最適解が得られることがわかった。
論文参考訳（メタデータ） (2023-10-01T11:25:20Z)
Secrets of RLHF in Large Language Models Part I: PPO [81.01936993929127]
大規模言語モデル (LLMs) は、人工知能の進歩のためのブループリントを定式化した。人間のフィードバックによる強化学習(RLHF)がこの追求を支える重要な技術パラダイムとして出現する。本稿では、RLHFの枠組みを解明し、PPOの内部構造を再評価し、PPOアルゴリズムを構成する部分が政策エージェントの訓練にどのように影響するかを考察する。
論文参考訳（メタデータ） (2023-07-11T01:55:24Z)
Factor Investing with a Deep Multi-Factor Model [123.52358449455231]
我々は、業界中立化と市場中立化モジュールを明確な財務見識をもって取り入れた、新しい深層多要素モデルを開発する。実世界の株式市場データによるテストは、我々の深層多要素モデルの有効性を示している。
論文参考訳（メタデータ） (2022-10-22T14:47:11Z)
Detecting and adapting to crisis pattern with context based Deep Reinforcement Learning [6.224519494738852]
本稿では、2つのサブネットワークで構成された革新的なDRLフレームワークを提案する。テストセットの結果、このアプローチはMarkowitzのような従来のポートフォリオ最適化手法を大幅に上回っており、現在のCovidのような危機を検出し予測することができる。
論文参考訳（メタデータ） (2020-09-07T12:11:08Z)
Robust Deep Reinforcement Learning against Adversarial Perturbations on State Observations [88.94162416324505]
深部強化学習(DRL)エージェントは、自然な測定誤差や対向雑音を含む観測を通して、その状態を観察する。観測は真の状態から逸脱するので、エージェントを誤解させ、準最適行動を起こすことができる。本研究は, 従来の手法を, 対人訓練などの分類タスクの堅牢性向上に応用することは, 多くのRLタスクには有効でないことを示す。
論文参考訳（メタデータ） (2020-03-19T17:59:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。