論文の概要: Cast-R1: Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting
- arxiv url: http://arxiv.org/abs/2602.13802v1
- Date: Sat, 14 Feb 2026 14:27:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.42876
- Title: Cast-R1: Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting
- Title(参考訳): Cast-R1: 時系列予測のための学習ツール強化シーケンス決定法
- Authors: Xiaoyu Tao, Mingyue Cheng, Chuang Jiang, Tian Gao, Huanjian Zhang, Yaguo Liu,
- Abstract要約: 本稿では,予測を逐次決定問題として再構成する学習時系列予測フレームワークであるCast-R1を提案する。
Cast-R1はメモリベースの状態管理機構を導入し、インタラクションステップ間の決定関連情報を維持する。
この定式化に基づいて、予測はツール拡張エージェントワークフローを通じて実行される。
- 参考スコア(独自算出の注目度): 22.256909587855905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series forecasting has long been dominated by model-centric approaches that formulate prediction as a single-pass mapping from historical observations to future values. Despite recent progress, such formulations often struggle in complex and evolving settings, largely because most forecasting models lack the ability to autonomously acquire informative evidence, reason about potential future changes, or revise predictions through iterative decision processes. In this work, we propose Cast-R1, a learned time series forecasting framework that reformulates forecasting as a sequential decision-making problem. Cast-R1 introduces a memory-based state management mechanism that maintains decision-relevant information across interaction steps, enabling the accumulation of contextual evidence to support long-horizon reasoning. Building on this formulation, forecasting is carried out through a tool-augmented agentic workflow, in which the agent autonomously interacts with a modular toolkit to extract statistical features, invoke lightweight forecasting models for decision support, perform reasoning-based prediction, and iteratively refine forecasts through self-reflection. To train Cast-R1, we adopt a two-stage learning strategy that combines supervised fine-tuning with multi-turn reinforcement learning, together with a curriculum learning scheme that progressively increases task difficulty to improve policy learning. Extensive experiments on multiple real-world time series datasets demonstrate the effectiveness of Cast-R1. We hope this work provides a practical step towards further exploration of agentic paradigms for time series modeling. Our code is available at https://github.com/Xiaoyu-Tao/Cast-R1-TS.
- Abstract(参考訳): 時系列予測は、歴史的観測から将来の値への単一パスマッピングとして予測を定式化するモデル中心のアプローチによって、長い間支配されてきた。
最近の進歩にもかかわらず、このような定式化はしばしば複雑で進化した設定に苦しむが、それはほとんどの予測モデルは、情報的証拠を自律的に取得したり、将来の変化を推論したり、反復的な決定プロセスを通じて予測を修正したりできないためである。
本研究では,予測を逐次決定問題として再定義する学習時系列予測フレームワークであるCast-R1を提案する。
Cast-R1はメモリベースの状態管理機構を導入し、インタラクションステップ間の決定関連情報を保持し、コンテキストエビデンスを蓄積して長期の推論をサポートする。
この定式化に基づいて、予測はツール拡張されたエージェントワークフローを通じて行われ、エージェントは、統計的特徴を抽出するためにモジュールツールキットと自律的に相互作用し、意思決定支援のための軽量な予測モデルを実行し、推論ベースの予測を実行し、自己回帰を通じて反復的に予測を洗練する。
Cast-R1を訓練するために、教師付き微調整と多ターン強化学習を組み合わせた2段階学習戦略と、段階的にタスクの難易度を高めて政策学習を改善するカリキュラム学習手法を採用する。
複数の実世界の時系列データセットに対する大規模な実験は、Cast-R1の有効性を実証している。
この研究が、時系列モデリングのためのエージェントパラダイムのさらなる探索に向けた実践的なステップを提供することを期待している。
私たちのコードはhttps://github.com/Xiaoyu-Tao/Cast-R1-TSで公開されています。
関連論文リスト
- Position: Beyond Model-Centric Prediction -- Agentic Time Series Forecasting [49.05788441962762]
エージェント時系列予測(ATSF)は,認識,計画,行動,反射,記憶からなるエージェントプロセスとして再編成される。
ワークフローに基づく設計、エージェント強化学習、ハイブリッドエージェントワークフローパラダイムという3つの代表的な実装パラダイムを概説し、モデル中心の予測からエージェント予測に移行する際に生じる機会と課題について議論する。
論文 参考訳(メタデータ) (2026-02-02T08:01:11Z) - SynCast: Synergizing Contradictions in Precipitation Nowcasting via Diffusion Sequential Preference Optimization [62.958457694151384]
本研究では,大規模な言語モデルにおける人的フィードバックからの強化学習の成功を動機として,降水量の最適化を初めて導入する。
第一段階では、フレームワークはFARを減らすことに焦点を当て、誤報を効果的に抑えるためにモデルを訓練する。
論文 参考訳(メタデータ) (2025-10-22T16:11:22Z) - Time Series Forecasting as Reasoning: A Slow-Thinking Approach with Reinforced LLMs [12.295608604703117]
Time-R1は、時系列予測のためのLLMの多段階推論能力を高めるために設計された2段階強化微調整フレームワークである。
具体的には、第1段はウォームアップ適応のための教師付き微調整を行い、第2段は強化学習を用いてモデルの一般化能力を向上させる。
実験によると、Time-R1は多様なデータセット間で予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2025-06-12T12:15:50Z) - Non-collective Calibrating Strategy for Time Series Forecasting [21.202820492929224]
時系列の複雑なダイナミクスは、黄金のモデルアーキテクチャを設計するための親指の規則を確立することを困難にしている。
我々は、資源コストを最小限に抑えて、既存の高度なモデルを普遍的な校正戦略で精錬することは、かなりの利益をもたらすと論じている。
Socket+Plug (SoP) と呼ばれる革新的な校正戦略を提案する。
論文 参考訳(メタデータ) (2025-05-29T10:14:26Z) - ReAugment: Model Zoo-Guided RL for Few-Shot Time Series Augmentation and Forecasting [74.00765474305288]
本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Predictive Churn with the Set of Good Models [61.00058053669447]
本稿では,予測的不整合という2つの無関係な概念の関連性について考察する。
予測多重性(英: predictive multiplicity)は、個々のサンプルに対して矛盾する予測を生成するモデルである。
2つ目の概念である予測チャーン(英: predictive churn)は、モデル更新前後の個々の予測の違いを調べるものである。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - MPR-Net:Multi-Scale Pattern Reproduction Guided Universality Time Series
Interpretable Forecasting [13.790498420659636]
時系列予測は、その広範な応用が本質的に困難なため、既存の研究から幅広い関心を集めている。
本稿では,まず,畳み込み操作を用いてマルチスケールの時系列パターンを適応的に分解し,パターン再現の既知に基づいてパターン拡張予測手法を構築し,最終的に畳み込み操作を用いて将来的なパターンを再構築する。
時系列に存在する時間的依存関係を活用することで、MPR-Netは線形時間複雑性を達成するだけでなく、予測プロセスも解釈できる。
論文 参考訳(メタデータ) (2023-07-13T13:16:01Z) - Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。
提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文 参考訳(メタデータ) (2022-07-11T21:17:41Z) - Learning Interpretable Deep State Space Model for Probabilistic Time
Series Forecasting [98.57851612518758]
確率的時系列予測は、その歴史に基づいて将来の分布を推定する。
本稿では,非線形エミッションモデルと遷移モデルとをネットワークによってパラメータ化した,確率的時系列予測のための深部状態空間モデルを提案する。
実験では,我々のモデルが正確かつ鋭い確率予測を生成することを示す。
論文 参考訳(メタデータ) (2021-01-31T06:49:33Z) - Learning Accurate Long-term Dynamics for Model-based Reinforcement
Learning [7.194382512848327]
より長い地平線で安定的に予測するために, 状態作用データに対する教師付き学習のための新しいパラメータ化を提案する。
シミュレーションおよび実験によるロボット作業の結果,軌道に基づくモデルにより,より正確な長期予測が得られた。
論文 参考訳(メタデータ) (2020-12-16T18:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。