Fugu-MT 論文翻訳(概要): A Novel Deep Reinforcement Learning Based Automated Stock Trading System Using Cascaded LSTM Networks

論文の概要: A Novel Deep Reinforcement Learning Based Automated Stock Trading System Using Cascaded LSTM Networks

arxiv url: http://arxiv.org/abs/2212.02721v2
Date: Wed, 26 Jul 2023 09:47:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-27 16:13:25.013011
Title: A Novel Deep Reinforcement Learning Based Automated Stock Trading System Using Cascaded LSTM Networks
Title（参考訳）: カスケードlstmネットワークを用いた新しい深層強化学習型自動株式取引システム
Authors: Jie Zou, Jiashu Lou, Baohua Wang, Sixue Liu
Abstract要約: そこで我々は,まずLSTMを用いて日次データから時系列特徴を抽出し,抽出した特徴を訓練エージェントに供給する,DRLベースの株式取引システムを提案する。米国の市場におけるDJIと中国の株式市場におけるSSE50の実験は、当社のモデルが累積リターンとシャープ比で従来のベースラインモデルを上回っていることを示している。
参考スコア（独自算出の注目度）: 3.593955557310285
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: More and more stock trading strategies are constructed using deep reinforcement learning (DRL) algorithms, but DRL methods originally widely used in the gaming community are not directly adaptable to financial data with low signal-to-noise ratios and unevenness, and thus suffer from performance shortcomings. In this paper, to capture the hidden information, we propose a DRL based stock trading system using cascaded LSTM, which first uses LSTM to extract the time-series features from stock daily data, and then the features extracted are fed to the agent for training, while the strategy functions in reinforcement learning also use another LSTM for training. Experiments in DJI in the US market and SSE50 in the Chinese stock market show that our model outperforms previous baseline models in terms of cumulative returns and Sharp ratio, and this advantage is more significant in the Chinese stock market, a merging market. It indicates that our proposed method is a promising way to build a automated stock trading system.
Abstract（参考訳）: 深層強化学習(DRL)アルゴリズムを用いて、より多くの株式取引戦略が構築されているが、ゲームコミュニティで広く使われているDRL手法は、信号対雑音比と不均一性の低い財務データに直接適応できないため、パフォーマンス上の欠点に悩まされている。本稿では,まずLSTMを用いて日次データから時系列特徴を抽出し,次に抽出した特徴をトレーニングエージェントに供給し,強化学習における戦略関数もトレーニングにLSTMを使用する,DRLベースの株式取引システムを提案する。米国市場におけるDJIと中国株式市場におけるSSE50の実験から、当社のモデルは累積リターンとシャープ比で従来のベースラインモデルよりも優れており、この優位性は、合併市場である中国株式市場においてより重要である。提案手法は,自動株式取引システムを構築する上で有望な方法であることを示す。

関連論文リスト

QTMRL: An Agent for Quantitative Trading Decision-Making Based on Multi-Indicator Guided Reinforcement Learning [5.438637626629327]
本稿では,多次元技術指標と強化学習(RL)を組み合わせた知的取引エージェントであるQTMRL(Quantitative Trading Multi-Indicator Reinforcement Learning)を提案する。まず,S&P 500日毎OHLCVデータ(2000-2022)を用いて,5つのセクターにまたがる16の代表的な在庫について,23年間のS&P500日毎OHLCVデータ(2000-2022)を用いて総合的多指標データセットを構築した。次に、データ処理、A2Cアルゴリズム、トレーディングエージェントモジュールを含むAdvantage Actor-Critic(A2C)アルゴリズムに基づく軽量RLフレームワークを設計する。
論文参考訳（メタデータ） (2025-08-28T06:37:41Z)
To Trade or Not to Trade: An Agentic Approach to Estimating Market Risk Improves Trading Decisions [0.0]
大規模言語モデル(LLM)はますますエージェントフレームワークにデプロイされている。我々は LLM を用いて金融時系列の微分方程式を反復的に発見するエージェントシステムを開発した。モデルインフォームドトレーディング戦略は標準LLMエージェントよりも優れていた。
論文参考訳（メタデータ） (2025-07-11T13:29:32Z)
Forecasting Nigerian Equity Stock Returns Using Long Short-Term Memory Technique [0.0]
株価のリターン予測は投資家の信頼を高める可能性があるが、依然として難しい課題だ。この問題に対処するために,Long Short-term Memory(LSTM)モデルを用いて,将来の株式市場の動きを予測する研究を行った。このモデルは、パフォーマンス指標を用いて評価され、人工ニューラルネットワークや畳み込みニューラルネットワーク(CNN)のような他のディープラーニングモデルと比較された。
論文参考訳（メタデータ） (2025-05-27T11:34:07Z)
Your Offline Policy is Not Trustworthy: Bilevel Reinforcement Learning for Sequential Portfolio Optimization [82.03139922490796]
強化学習(Reinforcement Learning, RL)は、過去のデータを用いたリスクを最小限にしつつ累積リターンを最大化することを目的とした、株式取引のような逐次的ポートフォリオ最適化タスクにおいて、大きな可能性を示してきた。従来のRLアプローチは、固定データセット内での振る舞いの購入と販売を最適に記憶するだけのポリシーを生成することが多い。当社のアプローチでは,ポートフォリオ最適化を新たなタイプの部分オフラインRL問題として捉え,2つの技術的貢献を行う。
論文参考訳（メタデータ） (2025-05-19T06:37:25Z)
A Deep Reinforcement Learning Approach to Automated Stock Trading, using xLSTM Networks [0.26249027950824505]
本研究では,拡張長短期記憶(xLSTM)ネットワークと深部強化学習(DRL)アプローチを併用して,自動株式取引に利用することを検討した。提案手法はアクターと批評家の両方でxLSTMネットワークを利用し,時系列データと動的市場環境の効果的処理を可能にする。
論文参考訳（メタデータ） (2025-03-12T10:56:03Z)
Agent Trading Arena: A Study on Numerical Understanding in LLM-Based Agents [69.58565132975504]
大規模言語モデル(LLM)は、自然言語処理において顕著な能力を示した。 LLMをベースとしたエージェントが競合するマルチエージェント取引を行う仮想ゼロサム株式市場であるエージェントトレーディングアリーナを提示する。
論文参考訳（メタデータ） (2025-02-25T08:41:01Z)
A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs [74.35290684163718]
大規模言語モデル(LLM)開発における最大の課題は、その面倒な事前トレーニングコストである。本稿では,小言語モデル(SLM)を活用して,LLMの事前学習効率と品質を改善するための有望なパラダイムについて検討する。
論文参考訳（メタデータ） (2024-10-24T14:31:52Z)
Social Debiasing for Fair Multi-modal LLMs [55.8071045346024]
MLLM(Multi-modal Large Language Models)は、強力な視覚言語理解機能を提供する。しかしながら、これらのモデルはトレーニングデータセットから深刻な社会的偏見を継承することが多く、人種や性別といった属性に基づいた不公平な予測につながります。本稿では,MLLMにおける社会的バイアスの問題に対処する。i)多元的社会的概念(CMSC)を用いた包括的対実的データセットの導入,i)アンチステレオタイプデバイアス戦略(ASD)を提案する。
論文参考訳（メタデータ） (2024-08-13T02:08:32Z)
Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。提案アルゴリズムはIRL問題の定常解に収束することを示す。その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文参考訳（メタデータ） (2024-05-28T07:11:05Z)
Commodities Trading through Deep Policy Gradient Methods [0.0]
商品取引問題を連続的な離散時間力学系として定式化する。アクターベースとアクタークリティカルベースの2つのポリシーアルゴリズムが導入された。先月末の天然ガス先物試験では、DRLモデルのシャープ比が買いと持ち株ベースラインと比較して83%高くなることが示されている。
論文参考訳（メタデータ） (2023-08-10T17:21:12Z)
Data Cross-Segmentation for Improved Generalization in Reinforcement Learning Based Algorithmic Trading [5.75899596101548]
本稿では,学習した予測モデルからの信号に基づいて処理を行う強化学習(RL)アルゴリズムを提案する。われわれのアルゴリズムは、ブルサ・マレーシアの20年以上のエクイティデータに基づいてテストしている。
論文参考訳（メタデータ） (2023-07-18T16:00:02Z)
HireVAE: An Online and Adaptive Factor Model Based on Hierarchical and Regime-Switch VAE [113.47287249524008]
オンラインで適応的な環境で株価予測を行うファクターモデルを構築することは、依然としてオープンな疑問である。本稿では,オンラインおよび適応型要素モデルであるHireVAEを,市場状況とストックワイド潜在要因の関係を埋め込んだ階層型潜在空間として提案する。 4つの一般的な実市場ベンチマークにおいて、提案されたHireVAEは、以前の手法よりもアクティブリターンの点で優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2023-06-05T12:58:13Z)
Asynchronous Deep Double Duelling Q-Learning for Trading-Signal Execution in Limit Order Book Markets [5.202524136984542]
我々は、エージェントを訓練し、高周波取引信号を個々のリミット注文を配置するトレーディング戦略に変換するために、深層強化学習を採用している。 ABIDESリミテッドオーダーブックシミュレータをベースとして,強化学習型オープンAIジム環境を構築した。我々はRLエージェントが在庫管理の効果的な取引戦略を学習し、同じ信号にアクセス可能なベンチマークトレーディング戦略より優れていることを見出した。
論文参考訳（メタデータ） (2023-01-20T17:19:18Z)
Augmented Bilinear Network for Incremental Multi-Stock Time-Series Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文参考訳（メタデータ） (2022-07-23T18:54:10Z)
Long Short-Term Memory Neural Network for Financial Time Series [0.0]
株価変動の予測のために,単体および並列長短期記憶ニューラルネットワークのアンサンブルを提案する。ストレートなトレーディング戦略では、ランダムに選択されたポートフォリオと指数のすべての株を含むポートフォリオを比較すると、LSTMアンサンブルから得られたポートフォリオが平均的なリターンと時間とともに高い累積リターンを提供することを示している。
論文参考訳（メタデータ） (2022-01-20T15:17:26Z)
Deep Stock Predictions [58.720142291102135]
本稿では,Long Short Term Memory (LSTM) ニューラルネットワークを用いてポートフォリオ最適化を行うトレーディング戦略の設計について考察する。次に、LSTMのトレーニングに使用する損失関数をカスタマイズし、利益を上げる。カスタマイズされた損失関数を持つLSTMモデルは、ARIMAのような回帰ベースライン上でのトレーニングボットの性能を向上させる。
論文参考訳（メタデータ） (2020-06-08T23:37:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。