論文の概要: Strat-LLM: Stratified Strategy Alignment for LLM-based Stock Trading with Real-time Multi-Source Signals
- arxiv url: http://arxiv.org/abs/2605.06024v1
- Date: Thu, 07 May 2026 11:17:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.716691
- Title: Strat-LLM: Stratified Strategy Alignment for LLM-based Stock Trading with Real-time Multi-Source Signals
- Title(参考訳): Strat-LLM:リアルタイムマルチソース信号を用いたLLMストックトレーディングのためのストラテファイド戦略アライメント
- Authors: Wenliang Huang, Zengyi Yu,
- Abstract要約: Strat-LLM は Stratified Strategy Alignment の基盤となるフレームワークである。
2025年を通してライブフォワードで活動している。
シーケンシャルな価格、リアルタイムニュース、年次レポートなどのデータを統合している。
- 参考スコア(独自算出の注目度): 1.4732811715354455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) are evolving into autonomous trading agents, yet existing benchmarks often overlook the interplay between architectural reasoning and strategy consistency. We propose Strat-LLM, a framework grounded in Stratified Strategy Alignment. Operating in a live-forward setting throughout 2025, it integrates heterogeneous data including sequential prices, real-time news, and annual reports to eliminate look-ahead bias. Extensive stress tests on A-share and U.S. markets reveal: (1) reasoning-heavy models achieve peak utility in Free Mode via internal logic, whereas standard models require Strict Mode as a vital risk anchor; (2) alignment utility is regime-dependent, with Free and Guided modes capturing momentum in uptrending markets, while Strict Mode mitigates drawdowns in downtrends; (3) mid-scale models (35B) show optimal fidelity under strict constraints, whereas ultra-large models (122B) suffer an alignment tax under rigid rules but gain a performance premium in Guided Mode; (4) standard LLMs often fall into a high win-rate trap, optimizing for small gains at the expense of total returns, which can only be mitigated through deep reasoning or strict external guardrails. Project details are available at https://Strat-LLM.github.io.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自律的なトレーディングエージェントへと進化している。
戦略アライメントに基づくフレームワークであるStrat-LLMを提案する。
2025年を通してライブフォワードで運用されている同社は、シーケンシャル価格、リアルタイムニュース、年次レポートなどの異種データを統合して、ルックアヘッドバイアスを排除している。
Aシェアと米国の市場における大規模なストレステストは、(1)推論重大モデルは、内部論理によるフリーモードにおけるピークユーティリティを実現するのに対し、標準モデルは、重要なリスクアンカーとして、厳格なモードを必要とする;(2)アライメントユーティリティは、上昇する市場で勢いを増すフリーモードとガイドモード、3)ダウントレンドにおけるドローダウンを緩和する、(3)中規模モデル(35B)は、厳格な制約の下で最適なフィリリティを示す一方、超大型モデル(122B)は、厳格な規則の下でアライメント税を被るが、ガイドドモードにおけるパフォーマンスプレミアムを得る、(4)標準LPMは、高利率のトラップに陥り、総利益のコストを最適化し、より厳密なガードや厳格な理由によってのみ軽減される。
プロジェクトの詳細はhttps://Strat-LLM.github.io.comで確認できる。
関連論文リスト
- StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction [76.50439715778869]
StraTAは、エージェント強化学習に明確な軌道レベルの戦略を導入するフレームワークである。
ALFWorld、WebShop、SciWorldの実験では、StraTAはサンプル効率と最終的なパフォーマンスの両方を一貫して改善している。
論文 参考訳(メタデータ) (2026-05-07T17:51:16Z) - RouteLMT: Learned Sample Routing for Hybrid LLM Translation Deployment [57.588738943463646]
大規模言語モデル(LLM)は機械翻訳(MT)において顕著な性能を発揮した
大規模に展開するのは 違法に高価です
モデル内ルータである textbfRouteLMT を提案する。
論文 参考訳(メタデータ) (2026-04-24T13:02:45Z) - Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - LLM-Guided Reinforcement Learning with Representative Agents for Traffic Modeling [2.8077601586229908]
大規模言語モデル(LLM)は、エージェントベースの交通モデルにおける自己関心の旅行者のための行動プロキシとして、ますます使われている。
我々は,同じ意思決定状況に直面する各同種旅行者グループを,単一の代表的LLMエージェントでモデル化することを提案する。
提案手法はユーザ均衡に急速に収束する。
論文 参考訳(メタデータ) (2025-11-09T07:36:46Z) - SFT Doesn't Always Hurt General Capabilities: Revisiting Domain-Specific Fine-Tuning in LLMs [53.77646961962239]
Supervised Fine-Tuning (SFT) は、大規模言語モデル(LLM)を特殊タスクに適用するための一般的なアプローチである。
より少ない学習率で一般的な性能劣化を著しく軽減することができる。
論文 参考訳(メタデータ) (2025-09-25T05:28:22Z) - End-to-End Large Portfolio Optimization for Variance Minimization with Neural Networks through Covariance Cleaning [0.0]
我々は,世界規模の最小分散ポートフォリオを提供する回転不変ニューラルネットワークを開発した。
この明示的な数学的写像は各加群の役割を明確に解釈できる。
単一モデルは数百株のパネルで校正でき、再訓練せずに1000米国株に適用される。
論文 参考訳(メタデータ) (2025-07-02T17:27:29Z) - Route to Reason: Adaptive Routing for LLM and Reasoning Strategy Selection [7.045509749924679]
Route-To-Reason(RTR)は、予算制約下でのタスク難易度に応じて、LMと推論戦略の両方を動的に割り当てる新しい統一ルーティングフレームワークである。
RTRは、専門家モデルと推論戦略の両方の圧縮された表現を学び、推論時に共同で適応的な選択を可能にする。
論文 参考訳(メタデータ) (2025-05-26T02:53:17Z) - Trajectory Bellman Residual Minimization: A Simple Value-Based Method for LLM Reasoning [55.33984461046492]
現在、政策に基づく手法が大規模言語モデル(LLM)推論のための強化学習パイプラインを支配している。
本稿では,このアイデアを LLM に自然に適応させるアルゴリズムである Trajectory Bellman Residual Minimization (TBRM) を紹介する。
我々は、軌道の軌道変更-測度分析の改善により、任意のオフ政治から、最適に近いKL正規化政策への収束を証明した。
論文 参考訳(メタデータ) (2025-05-21T09:41:53Z) - Test-Time Fairness and Robustness in Large Language Models [17.758735680493917]
Frontier Large Language Models (LLM) は、社会的に差別的であるか、その入力の刺激的な特徴に敏感である。
既存のソリューションは、LLMに公正か堅牢かを指示し、モデルのバイアスに対する暗黙の理解に依存します。
暗黙的な指示とは異なり、我々のプロンプト戦略は、フロンティアLSMのバイアスを一貫して減少させることを示す。
論文 参考訳(メタデータ) (2024-06-11T20:05:15Z) - Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL [57.202733701029594]
本稿では,自己進化型政策学習戦略を持つ新しい多粒状態空間モデル(SSM)であるDecision Mambaを提案する。
これらの課題に対処するため、我々は自己進化型政策学習戦略を持つ新しい多粒状態空間モデル(SSM)であるDecision Mambaを提案する。
雑音性軌道上における過度に適合する問題を緩和するために,進行正則化を用いて自己進化政策を提案する。
論文 参考訳(メタデータ) (2024-06-08T10:12:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。