Fugu-MT 論文翻訳(概要): Reasoning through Verifiable Forecast Actions: Consistency-Grounded RL for Financial LLMs

論文の概要: Reasoning through Verifiable Forecast Actions: Consistency-Grounded RL for Financial LLMs

arxiv url: http://arxiv.org/abs/2605.21975v1
Date: Thu, 21 May 2026 04:09:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-22 20:14:18.520075
Title: Reasoning through Verifiable Forecast Actions: Consistency-Grounded RL for Financial LLMs
Title（参考訳）: 検証可能な予測行動による推論:金融LLMにおける一貫性を考慮したRL
Authors: Jialin Chen, Aosong Feng, Harshit Verma, Siyi Gu, Haiwen Wang, Ali Maatouk, Yixuan He, Yifeng Gao, Leandros Tassiulas, Rex Ying,
Abstract要約: 本発表では、株価予測と財務的理由を検証可能な予測行動を通じて統合する、時系列のLLMであるStockR1を紹介する。ツールコール設計に基づいて、モデルはまず、定性的市場展望の構造的かつ解釈可能な表現である予測アクションを出力する。そこでは、回答の妥当性、予測精度、生成したアクション間の一貫性と観察された時系列のダイナミクスを共同で反映する。
参考スコア（独自算出の注目度）: 34.87727677131385
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Financial markets are characterized by extreme non-stationarity, low signal-to-noise ratios, and strong dependence on external information such as news, company fundamentals, and macroeconomic signals. Yet, existing approaches either abstract time-series into text or decouple forecasting from language-based reasoning, leading to a fundamental mismatch between qualitative reasoning and quantitative outcomes. To address this, we introduce StockR1, a time-series-enhanced LLM that unifies stock forecasting and financial reasoning through a verifiable forecast action. Based on a tool-call design, the model first emits a forecast action, which is a structured and interpretable representation of its qualitative market outlook. It then invokes a time-series decoder conditioned on this action to generate distributional future trajectories, leading to more informed question answering and financial reasoning. We optimize the full pipeline with reinforcement learning, where rewards jointly reflect answer validity, forecast accuracy, and consistency between generated actions and observed time-series dynamics. In addition, rewards are reweighted by a sample-level uncertainty scalar, encouraging the model to accommodate varying uncertainty in market dynamics. We evaluate StockR1 on financial question answering and stock forecasting over a large-scale 10-year benchmark. Our method consistently outperforms time-series baselines and general-purpose LLMs, improving reasoning accuracy by 17.7% (4B) and 25.9% (8B). These findings demonstrate that structuring the forecast actions establishes a powerful synergy between language reasoning and temporal prediction, enabling LLMs to reason through verifiable, interpretable, and numerically grounded decisions.
Abstract（参考訳）: 金融市場は、極端な非定常性、低信号対雑音比、ニュース、企業の基本、マクロ経済信号などの外部情報への強い依存が特徴である。しかし、既存のアプローチは、テキストに時系列を抽象化するか、言語に基づく推論から予測を分離するかのいずれかであり、質的な推論と定量的な結果の根本的なミスマッチにつながる。これに対応するため、検証可能な予測行動を通じて、株価予測と財務理由を統一する時系列のLLMであるStockR1を紹介する。ツールコール設計に基づいて、モデルはまず、定性的市場展望の構造的かつ解釈可能な表現である予測アクションを出力する。その後、この動作に条件付けられた時系列デコーダを起動し、分散的な将来の軌跡を生成し、より深い質問応答と金銭的推論をもたらす。そこでは、回答の妥当性、予測精度、生成したアクション間の一貫性と観察された時系列のダイナミクスを共同で反映する。さらに、報酬はサンプルレベルの不確実性スカラーによって再重み付けされ、市場ダイナミクスの様々な不確実性に対応するようモデルに促される。大規模な10年ベンチマークで、金融質問応答と株価予測について、StockR1を評価する。本手法は時系列ベースラインと汎用LLMを一貫して上回り,推論精度を17.7% (4B) および25.9% (8B) 向上させる。これらの結果は,予測行動の構造化が言語推論と時間予測の強力な相乗効果を確立し,LLMが検証し,解釈し,数値的に下した決定を通じて推論できることを示す。

関連論文リスト

Nexus : An Agentic Framework for Time Series Forecasting [72.73790673303154]
時系列予測は、ニュースやイベントのような構造化されていないコンテキストデータによる推論を必要とする。予測を特殊なステージに分解するマルチエージェント予測フレームワークであるNexusを紹介します。本研究では,現在のLLMは,従来よりも強い固有予測能力を有することを示す。
論文参考訳（メタデータ） (2026-05-14T05:12:13Z)
LEAF: A Living Benchmark for Event-Augmented Forecasting [78.94019460534442]
LEAFは、イベント拡張予測タスクの最初の生きたベンチマークである。我々は最先端のプロプライエタリかつオープンウェイトなLLMを評価した。 LLMは、より予測し易いと自信を持って判断し、より優れたパフォーマンスを実現する。
論文参考訳（メタデータ） (2026-05-09T03:17:59Z)
Context-Integrated Adversarial Learning for Predictive Modelling of Stock Price Dynamics [0.0]
本稿では,文脈に敏感な対人学習モデルを導入し,株価の予測を行う。このアーキテクチャは、将来の価格変動をモデル化するために敵対的トレーニングを使用し、財務的なテキストデータから派生した文脈的感情特徴を取り入れている。米国株式のサンプルを実験的に評価すると、提案手法が従来のARIMAおよびLSTMベースラインを様々な誤差の尺度で上回っていることが証明される。
論文参考訳（メタデータ） (2026-04-13T18:51:01Z)
The Forecast Critic: Leveraging Large Language Models for Poor Forecast Identification [74.64864354503204]
本稿では,Large Language Models (LLM) を利用した予測自動監視システムであるThe Forecast Criticを提案する。 LLMの時系列予測品質を評価する能力を評価する。合成および実世界の予測データを含む3つの実験を行った。
論文参考訳（メタデータ） (2025-12-12T21:59:53Z)
FinZero: Launching Multi-modal Financial Time Series Forecast with Large Reasoning Model [27.20045729222667]
FinZeroは、FVLDBファイナンシャル時系列の推論、予測、分析的理解を行うために、UARPOによって微調整されたマルチモーダル事前訓練モデルである。 UARPOで微調整した後、FinZeroは高信頼グループのGPT-4oよりも予測精度が約13.48%向上した。
論文参考訳（メタデータ） (2025-09-10T16:32:41Z)
FinHEAR: Human Expertise and Adaptive Risk-Aware Temporal Reasoning for Financial Decision-Making [58.04602111184477]
FinHEARは、人間の専門知識と適応的リスク認識推論のためのフレームワークである。専門のエージェントを編成し、過去の傾向を分析し、現在の出来事を解釈し、専門家にインフォームドされた前例を検索する。金融データセットの実証的な結果から、FinHEARはトレンド予測やトレーディングタスクにおいて、一貫して強いベースラインを上回ります。
論文参考訳（メタデータ） (2025-06-10T04:06:51Z)
Consistency Checks for Language Model Forecasters [54.62507816753479]
予測器の性能を,論理的に異なる質問に対する予測の整合性の観点から測定する。我々は,一連の基本質問を生成し,これらの質問から整合性チェックをインスタンス化し,予測者の予測を導き,予測の整合性を測定する自動評価システムを構築した。
論文参考訳（メタデータ） (2024-12-24T16:51:35Z)
Financial Time-Series Forecasting: Towards Synergizing Performance And Interpretability Within a Hybrid Machine Learning Approach [2.0213537170294793]
本稿では、ハイブリッド機械学習アルゴリズムの比較研究を行い、モデル解釈可能性の向上に活用する。本稿では,金融時系列予測において出現する潜伏関係や複雑なパターンの発掘を目的とした,分解,自己相関関数,指数的三重予測など,時系列統計の事前処理技術に関する体系的な概要を述べる。
論文参考訳（メタデータ） (2023-12-31T16:38:32Z)
Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [48.87381259980254]
我々は、ChatGPTのような大規模言語モデル(LLM)が、直接の金融トレーニングなしでニュースの見出しから株式市場の反応を予測する能力について文書化している。 GPT-4は、認識後カットオフの見出しを使って、最初の市場の反応を捉え、取引不能な初期反応に対して、ポートフォリオの1日当たりのヒット率を約90%達成している。
論文参考訳（メタデータ） (2023-04-15T19:22:37Z)
Stock Broad-Index Trend Patterns Learning via Domain Knowledge Informed Generative Network [2.1163070161951865]
本稿では、市場固有の特性を意図的に設計したインデックスGANを提案する。また、実数列と予測列の間のワッサーシュタイン距離を近似するために批判を利用する。
論文参考訳（メタデータ） (2023-02-27T21:56:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。