論文の概要: Trading-R1: Financial Trading with LLM Reasoning via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2509.11420v1
- Date: Sun, 14 Sep 2025 20:13:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.076462
- Title: Trading-R1: Financial Trading with LLM Reasoning via Reinforcement Learning
- Title(参考訳): トレーディング-R1:強化学習によるLLM推論による金融取引
- Authors: Yijia Xiao, Edward Sun, Tong Chen, Fang Wu, Di Luo, Wei Wang,
- Abstract要約: トレーディング-R1は、戦略的思考と包括的テーマ構成の計画、事実に基づく分析、ボラティリティ調整による意思決定を組み込んだ金融モデルである。
このシステムは、規律と解釈可能な取引決定をサポートする構造化されたエビデンスベースの投資成果を生成する。
- 参考スコア(独自算出の注目度): 19.52468210547666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing professional, structured reasoning on par with human financial analysts and traders remains a central challenge in AI for finance, where markets demand interpretability and trust. Traditional time-series models lack explainability, while LLMs face challenges in turning natural-language analysis into disciplined, executable trades. Although reasoning LLMs have advanced in step-by-step planning and verification, their application to risk-sensitive financial decisions is underexplored. We present Trading-R1, a financially-aware model that incorporates strategic thinking and planning for comprehensive thesis composition, facts-grounded analysis, and volatility-adjusted decision making. Trading-R1 aligns reasoning with trading principles through supervised fine-tuning and reinforcement learning with a three-stage easy-to-hard curriculum. Training uses Tauric-TR1-DB, a 100k-sample corpus spanning 18 months, 14 equities, and five heterogeneous financial data sources. Evaluated on six major equities and ETFs, Trading-R1 demonstrates improved risk-adjusted returns and lower drawdowns compared to both open-source and proprietary instruction-following models as well as reasoning models. The system generates structured, evidence-based investment theses that support disciplined and interpretable trading decisions. Trading-R1 Terminal will be released at https://github.com/TauricResearch/Trading-R1.
- Abstract(参考訳): 人間の金融アナリストやトレーダーと同等に構造化されたプロの推論を開発することは、市場が解釈可能性と信頼を要求する金融のAIにおいて、依然として中心的な課題である。
伝統的な時系列モデルは説明可能性に欠けるが、LLMは自然言語分析を規律のある実行可能な取引に転換する際の課題に直面している。
推論LSMは段階的に計画と検証を進めてきたが、リスクに敏感な金融決定への適用は過小評価されている。
本稿では,戦略的思考と包括的テーマ構成の計画,ファクトグラウンド分析,ボラティリティ調整による意思決定を取り入れた金融モデルであるTrding-R1を提案する。
トレーディング-R1は、3段階の簡単なカリキュラムで微調整と強化学習を指導することで、取引原則と推論を整合させる。
Tauric-TR1-DBは18ヶ月、14株、および5つの異種金融データソースにまたがる100kサンプルコーパスである。
6つの主要な株式とETFを評価したTrading-R1は、オープンソースおよびプロプライエタリな命令フォローモデルおよび推論モデルと比較して、リスク調整されたリターンと低損失の改善を示す。
このシステムは、規律と解釈可能な取引決定をサポートする構造化されたエビデンスベースの投資成果を生成する。
Trading-R1 Terminalはhttps://github.com/TauricResearch/Trading-R1でリリースされる。
関連論文リスト
- Your AI, Not Your View: The Bias of LLMs in Investment Analysis [55.328782443604986]
大規模言語モデル(LLM)は、事前訓練されたパラメトリック知識とリアルタイム市場データとの相違により、しばしば知識の衝突に直面している。
本稿では, LLMに基づく投資分析において, 確認バイアスの定量的分析を行った。
われわれは、大口株に対する一貫した選好と、ほとんどのモデルにおけるコントラリアン戦略を観察する。
論文 参考訳(メタデータ) (2025-07-28T16:09:38Z) - To Trade or Not to Trade: An Agentic Approach to Estimating Market Risk Improves Trading Decisions [0.0]
大規模言語モデル(LLM)はますますエージェントフレームワークにデプロイされている。
我々は LLM を用いて金融時系列の微分方程式を反復的に発見するエージェントシステムを開発した。
モデルインフォームドトレーディング戦略は標準LLMエージェントよりも優れていた。
論文 参考訳(メタデータ) (2025-07-11T13:29:32Z) - When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - FinLlama: Financial Sentiment Classification for Algorithmic Trading Applications [2.2661367844871854]
大規模言語モデル(LLM)はこの文脈で使用することができるが、財務に特化せず、重要な計算資源を必要とする傾向がある。
我々はLlama 2 7Bの基礎モデルに基づく新しいアプローチを導入し,その生成特性と包括的言語操作の利点を享受する。
これは、Llama2 7Bモデルを教師付き財務感情分析データの一部に微調整することで達成される。
論文 参考訳(メタデータ) (2024-03-18T22:11:00Z) - Are LLMs Rational Investors? A Study on Detecting and Reducing the Financial Bias in LLMs [44.53203911878139]
大規模言語モデル(LLM)は、複雑な市場データとトレンドを解釈する金融分析において、ますます採用されている。
Financial Bias Indicators (FBI)は、Bias Unveiler、Bias Detective、Bias Tracker、Bias Antidoteといったコンポーネントを備えたフレームワークである。
我々は、23のLLMを評価し、財務因果知識に基づく非バイアス化手法を提案する。
論文 参考訳(メタデータ) (2024-02-20T04:26:08Z) - Combining Deep Learning on Order Books with Reinforcement Learning for
Profitable Trading [0.0]
本研究は,注文フローを用いた複数地平線におけるリターン予測と,5つの金融機器を対象とした3つの時間差不均衡学習モデルを訓練することに焦点を当てる。
この結果は潜在的な可能性を証明しているが、小売取引コスト、滑り込み、スプレッド・揺らぎを完全に処理するためには、一貫した黒字取引のためのさらなる最小限の修正が必要である。
論文 参考訳(メタデータ) (2023-10-24T15:58:58Z) - Factor Investing with a Deep Multi-Factor Model [123.52358449455231]
我々は、業界中立化と市場中立化モジュールを明確な財務見識をもって取り入れた、新しい深層多要素モデルを開発する。
実世界の株式市場データによるテストは、我々の深層多要素モデルの有効性を示している。
論文 参考訳(メタデータ) (2022-10-22T14:47:11Z) - Trader-Company Method: A Metaheuristic for Interpretable Stock Price
Prediction [3.9189409002585562]
金融市場では、機械学習ベースのモデルの実践的応用を妨げるいくつかの課題がある。
本稿では,金融機関とトレーダーの役割を模倣する新たな進化モデルであるTrader-Company法を提案する。
トレーダーと呼ばれる複数の弱い学習者からの提案を集約し、将来の株式リターンを予測します。
論文 参考訳(メタデータ) (2020-12-18T13:19:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。