論文の概要: News-Aware Direct Reinforcement Trading for Financial Markets
- arxiv url: http://arxiv.org/abs/2510.19173v1
- Date: Wed, 22 Oct 2025 02:17:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:14.932111
- Title: News-Aware Direct Reinforcement Trading for Financial Markets
- Title(参考訳): ニュース対応型金融市場向け直接強化トレーディング
- Authors: Qing-Yu Lan, Zhan-He Wang, Jun-Qian Jiang, Yu-Tong Wang, Yun-Song Piao,
- Abstract要約: 本研究では,大規模言語モデルから得られるニュース感情スコアと,原価および音量データとを,強化学習のための可観測入力として用いる。
これらの入力は、リカレントニューラルネットワークやTransformerなどのシーケンスモデルによって処理され、エンドツーエンドのトレーディング決定を行う。
その結果,手作業による特徴や手作業によるルールに依存しない我々のニューズアウェアアプローチは,市場ベンチマークよりも優れた性能を実現することができた。
- 参考スコア(独自算出の注目度): 4.651395723728895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The financial market is known to be highly sensitive to news. Therefore, effectively incorporating news data into quantitative trading remains an important challenge. Existing approaches typically rely on manually designed rules and/or handcrafted features. In this work, we directly use the news sentiment scores derived from large language models, together with raw price and volume data, as observable inputs for reinforcement learning. These inputs are processed by sequence models such as recurrent neural networks or Transformers to make end-to-end trading decisions. We conduct experiments using the cryptocurrency market as an example and evaluate two representative reinforcement learning algorithms, namely Double Deep Q-Network (DDQN) and Group Relative Policy Optimization (GRPO). The results demonstrate that our news-aware approach, which does not depend on handcrafted features or manually designed rules, can achieve performance superior to market benchmarks. We further highlight the critical role of time-series information in this process.
- Abstract(参考訳): 金融市場はニュースに非常に敏感であることが知られている。
したがって、定量的取引にニュースデータを効果的に取り入れることは重要な課題である。
既存のアプローチは通常、手作業で設計されたルールや手作業による機能に依存します。
本研究では,大規模言語モデルから得られるニュース感情スコアと,原価とボリュームデータを直接,強化学習のための可観測入力として利用する。
これらの入力は、リカレントニューラルネットワークやTransformerなどのシーケンスモデルによって処理され、エンドツーエンドのトレーディング決定を行う。
本稿では,暗号通貨市場を例として,Double Deep Q-Network (DDQN) と Group Relative Policy Optimization (GRPO) の2つの代表的な強化学習アルゴリズムを評価する。
その結果,手作業による特徴や手作業によるルールに依存しない我々のニューズアウェアアプローチは,市場ベンチマークよりも優れた性能を実現することができた。
このプロセスにおける時系列情報の重要性をさらに強調する。
関連論文リスト
- Trade in Minutes! Rationality-Driven Agentic System for Quantitative Financial Trading [57.28635022507172]
TiMiは、アーキテクチャ上、戦略開発を分単位のデプロイメントから切り離す合理性駆動型マルチエージェントシステムである。
本稿では,マクロパターンからマイクロカスタマイズ,トレーディングボット実装のための階層型プログラミング設計,数学的リフレクションによって駆動されるクローズドループ最適化までの2層解析パラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-06T13:08:55Z) - Forgetting: A New Mechanism Towards Better Large Language Model Fine-tuning [51.92313556418432]
Supervised Fine-tuning (SFT) は、事前訓練された大規模言語モデル (LLM) において重要な役割を果たす。
各コーパス内のトークンを、モデルパフォーマンスを改善するのに有用かどうかに基づいて、正と負の2つの部分に分類することを提案する。
我々は、よく確立されたベンチマークで実験を行い、この忘れるメカニズムが全体のモデル性能を向上するだけでなく、より多様なモデル応答を促進することを発見した。
論文 参考訳(メタデータ) (2025-08-06T11:22:23Z) - Agent Trading Arena: A Study on Numerical Understanding in LLM-Based Agents [69.58565132975504]
大規模言語モデル(LLM)は、自然言語処理において顕著な能力を示した。
LLMをベースとしたエージェントが競合するマルチエージェント取引を行う仮想ゼロサム株式市場であるエージェントトレーディングアリーナを提示する。
論文 参考訳(メタデータ) (2025-02-25T08:41:01Z) - MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU [29.760324699979417]
本稿では,多頭部クロスアテンション機構と改良型GRUに基づくストック予測モデルMCI-GRUを提案する。
4つの主要株式市場での実験では、提案手法は複数の指標でSOTA技術を上回っている。
論文 参考訳(メタデータ) (2024-09-25T14:37:49Z) - Data Cross-Segmentation for Improved Generalization in Reinforcement
Learning Based Algorithmic Trading [5.75899596101548]
本稿では,学習した予測モデルからの信号に基づいて処理を行う強化学習(RL)アルゴリズムを提案する。
われわれのアルゴリズムは、ブルサ・マレーシアの20年以上のエクイティデータに基づいてテストしている。
論文 参考訳(メタデータ) (2023-07-18T16:00:02Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - Augmented Bilinear Network for Incremental Multi-Stock Time-Series
Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。
本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。
この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文 参考訳(メタデータ) (2022-07-23T18:54:10Z) - Trader-Company Method: A Metaheuristic for Interpretable Stock Price
Prediction [3.9189409002585562]
金融市場では、機械学習ベースのモデルの実践的応用を妨げるいくつかの課題がある。
本稿では,金融機関とトレーダーの役割を模倣する新たな進化モデルであるTrader-Company法を提案する。
トレーダーと呼ばれる複数の弱い学習者からの提案を集約し、将来の株式リターンを予測します。
論文 参考訳(メタデータ) (2020-12-18T13:19:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。