論文の概要: Deep Q-Network (DQN) multi-agent reinforcement learning (MARL) for Stock Trading
- arxiv url: http://arxiv.org/abs/2505.03949v1
- Date: Tue, 06 May 2025 19:55:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.906944
- Title: Deep Q-Network (DQN) multi-agent reinforcement learning (MARL) for Stock Trading
- Title(参考訳): ストックトレーディングのためのディープQネットワーク(DQN)マルチエージェント強化学習(MARL)
- Authors: John Christopher Tidwell, John Storm Tidwell,
- Abstract要約: このプロジェクトは、従来の手法と直接強化学習(RL)が市場ノイズ、複雑さ、一般化に苦しむ、自動株式取引の課題に対処する。
提案手法は,画像としてフォーマットされた技術指標のパターンを識別する畳み込みニューラルネットワーク(CNN)と,価格履歴と技術指標の両方にわたる時間的依存関係をキャプチャする長短短期メモリ(LSTM)ネットワークと,CNNとLSTMが抽出した特徴に基づいて最適な取引ポリシー(購入,販売,保持)を学習するDeep Q-Network(DQN)エージェントを組み合わせた統合ディープラーニングフレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This project addresses the challenge of automated stock trading, where traditional methods and direct reinforcement learning (RL) struggle with market noise, complexity, and generalization. Our proposed solution is an integrated deep learning framework combining a Convolutional Neural Network (CNN) to identify patterns in technical indicators formatted as images, a Long Short-Term Memory (LSTM) network to capture temporal dependencies across both price history and technical indicators, and a Deep Q-Network (DQN) agent which learns the optimal trading policy (buy, sell, hold) based on the features extracted by the CNN and LSTM.
- Abstract(参考訳): このプロジェクトは、従来の手法と直接強化学習(RL)が市場ノイズ、複雑さ、一般化に苦しむ、自動株式取引の課題に対処する。
提案手法は,画像としてフォーマットされた技術指標のパターンを識別する畳み込みニューラルネットワーク(CNN)と,価格履歴と技術指標の両方にわたる時間的依存関係をキャプチャする長短短期メモリ(LSTM)ネットワークと,CNNとLSTMが抽出した特徴に基づいて最適な取引ポリシー(購入,販売,保持)を学習するDeep Q-Network(DQN)エージェントを組み合わせた統合ディープラーニングフレームワークである。
関連論文リスト
- A Hierarchical conv-LSTM and LLM Integrated Model for Holistic Stock Forecasting [0.0]
本稿では,Large Language Model (LLM) と統合された新しい2レベル Conv-LSTM Neural Network を提案する。
第1段階では、歴史的株価と技術的指標の局所的なパターンを特定するために畳み込み層が使用され、続いてLSTM層が時間的ダイナミクスを捉えている。
第2のレベルは、感情や文脈情報をテキストデータから分析するLLMと出力を統合し、市場状況の全体像を提供する。
論文 参考訳(メタデータ) (2024-09-30T17:04:42Z) - A Novel Deep Reinforcement Learning Based Automated Stock Trading System
Using Cascaded LSTM Networks [3.593955557310285]
そこで我々は,まずLSTMを用いて日次データから時系列特徴を抽出し,抽出した特徴を訓練エージェントに供給する,DRLベースの株式取引システムを提案する。
米国の市場におけるDJIと中国の株式市場におけるSSE50の実験は、当社のモデルが累積リターンとシャープ比で従来のベースラインモデルを上回っていることを示している。
論文 参考訳(メタデータ) (2022-12-06T03:22:06Z) - Teal: Learning-Accelerated Optimization of WAN Traffic Engineering [68.7863363109948]
本稿では,GPUの並列処理能力を活用してTE制御を高速化する学習型TEアルゴリズムTealを提案する。
問題スケールの削減と学習のトラクタビリティ向上のために,Tealはマルチエージェント強化学習(RL)アルゴリズムを用いて,各トラフィック要求を独立に割り当てる。
他のTE加速方式と比較して、Tealは需要を6~32%増やし、197~625倍のスピードアップを達成している。
論文 参考訳(メタデータ) (2022-10-25T04:46:30Z) - Trading with the Momentum Transformer: An Intelligent and Interpretable
Architecture [2.580765958706854]
我々は、ベンチマークを上回るアテンションベースのアーキテクチャであるMomentum Transformerを紹介した。
注意パターンの顕著な構造を観察し,運動量回転点における重要なピークを観測した。
解釈可能な変数選択ネットワークを追加することで、PDは日々のリターンデータに基づいて、モデルがトレーディングから遠ざけるのにどう役立つかを観察する。
論文 参考訳(メタデータ) (2021-12-16T00:04:12Z) - Low-bit Quantization of Recurrent Neural Network Language Models Using
Alternating Direction Methods of Multipliers [67.688697838109]
本稿では、乗算器の交互方向法(ADMM)を用いて、スクラッチから量子化RNNLMを訓練する新しい手法を提案する。
2つのタスクの実験から、提案されたADMM量子化は、完全な精度ベースライン RNNLM で最大31倍のモデルサイズ圧縮係数を達成したことが示唆された。
論文 参考訳(メタデータ) (2021-11-29T09:30:06Z) - Semi-supervised Network Embedding with Differentiable Deep Quantisation [81.49184987430333]
我々はネットワーク埋め込みのための微分可能な量子化法であるd-SNEQを開発した。
d-SNEQは、学習された量子化符号にリッチな高次情報を与えるためにランク損失を組み込む。
トレーニング済みの埋め込みのサイズを大幅に圧縮できるため、ストレージのフットプリントが減少し、検索速度が向上する。
論文 参考訳(メタデータ) (2021-08-20T11:53:05Z) - Online learning of windmill time series using Long Short-term Cognitive
Networks [58.675240242609064]
風車農場で生成されたデータの量は、オンライン学習が従うべき最も有効な戦略となっている。
我々はLong Short-term Cognitive Networks (LSTCNs) を用いて、オンライン環境での風車時系列を予測する。
提案手法は,単純なRNN,長期記憶,Gated Recurrent Unit,Hidden Markov Modelに対して最も低い予測誤差を報告した。
論文 参考訳(メタデータ) (2021-07-01T13:13:24Z) - Model-Based Machine Learning for Communications [110.47840878388453]
モデルベースのアルゴリズムと機械学習をハイレベルな視点で組み合わせるための既存の戦略を見直します。
通信受信機の基本的なタスクの一つであるシンボル検出に注目する。
論文 参考訳(メタデータ) (2021-01-12T19:55:34Z) - Detecting and adapting to crisis pattern with context based Deep
Reinforcement Learning [6.224519494738852]
本稿では、2つのサブネットワークで構成された革新的なDRLフレームワークを提案する。
テストセットの結果、このアプローチはMarkowitzのような従来のポートフォリオ最適化手法を大幅に上回っており、現在のCovidのような危機を検出し予測することができる。
論文 参考訳(メタデータ) (2020-09-07T12:11:08Z) - Deep Stock Predictions [58.720142291102135]
本稿では,Long Short Term Memory (LSTM) ニューラルネットワークを用いてポートフォリオ最適化を行うトレーディング戦略の設計について考察する。
次に、LSTMのトレーニングに使用する損失関数をカスタマイズし、利益を上げる。
カスタマイズされた損失関数を持つLSTMモデルは、ARIMAのような回帰ベースライン上でのトレーニングボットの性能を向上させる。
論文 参考訳(メタデータ) (2020-06-08T23:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。