論文の概要: AION: Next-Generation Tasks and Practical Harness for Time Series
- arxiv url: http://arxiv.org/abs/2605.25045v1
- Date: Sun, 24 May 2026 12:42:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.671974
- Title: AION: Next-Generation Tasks and Practical Harness for Time Series
- Title(参考訳): AION:次世代タスクと時系列の実践的ハーネス
- Authors: Tianxiang Zhan, Xiaobao Song, Tong Guan, Shirui Pan, Ming Jin,
- Abstract要約: まず、タスクファイル、ワークスペース、バリデーションインターフェースからなる3つのコンポーネントとして、次世代の時系列タスクを定式化する。
次に、エージェント、スキル、ルール、メモリ、評価、プロトコルの6つのコンポーネントグループから構築された時系列ハーネスであるAIONを紹介します。
このハーネスでは、時間的根拠付け、時間的知識に基づく推論、実験後の分析や階層化レビューなどの信頼性メカニズムの3つの設計原則を用いる。
- 参考スコア(独自算出の注目度): 45.09526710303026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Time series research is moving beyond fixed forecasting benchmarks toward realistic tasks that combine prediction, contextual reasoning, tool use, and structured decision support. Most benchmarks are built around clean data and short evaluation loops; agents alone may miss temporal constraints, evidence checks, or review before finalizing outputs. We first formalize next-generation time series tasks as three-component tuples consisting of a task file, a workspace, and a validation interface. We then present AION, a time series harness built from six component groups: agents, skills, rules, memory, evaluation, and protocols. In this harness, we use three design principles: temporal grounding, temporal knowledge-grounded reasoning, and reliability mechanisms such as post-experiment analysis and layered review. A Kaggle Store Sales case study shows that the harness produces more detailed process traces, more artifacts, and more review steps than the same base agent operating in OpenCode direct build mode. Taken together, these results argue for a paradigm shift from fixed tasks to realistic ones under real-world constraints.
- Abstract(参考訳): 時系列研究は、予測、文脈推論、ツールの使用、構造化された意思決定支援を組み合わせた現実的なタスクへと、固定された予測ベンチマークを超えて進んでいる。
ほとんどのベンチマークはクリーンなデータと短い評価ループを中心に構築されている。
まず、タスクファイル、ワークスペース、バリデーションインターフェースからなる3成分タプルとして、次世代の時系列タスクを定式化する。
次に、エージェント、スキル、ルール、メモリ、評価、プロトコルの6つのコンポーネントグループから構築された時系列ハーネスであるAIONを紹介します。
このハーネスでは、時間的根拠付け、時間的知識に基づく推論、実験後の分析や階層化レビューなどの信頼性メカニズムの3つの設計原則を用いる。
Kaggle Store Salesのケーススタディによると、ハーネスはOpenCode直接ビルドモードで動作する同じベースエージェントよりも詳細なプロセストレース、アーティファクト、レビューステップを生成する。
これらの結果は、固定されたタスクから現実的なタスクへのパラダイムシフトを現実の制約の下で主張する。
関連論文リスト
- TimeClaw: A Time-Series AI Agent with Exploratory Execution Learning [22.232550112727267]
時系列分析は、金融や天気などの分野における予測、監視、意思決定の基盤となっている。
探索的実行を再利用可能な階層的蒸留体験に変換する探索的実行学習フレームワークであるTimeClawを提案する。
論文 参考訳(メタデータ) (2026-05-11T06:09:17Z) - An Embarrassingly Simple Graph Heuristic Reveals Shortcut-Solvable Benchmarks for Sequential Recommendation [50.09718257952108]
Sequentialsolvは、シーケンシャルなパターンとセマンティックなアイテム情報を組み合わせたジェネレーティブなレコメンデーターへと移行している。
これらの手法は、しばしば、広く使われている少数のベンチマークで評価され、重要な疑問を提起する: これらのベンチマークは、現代のジェネレーティブレコメンデーターが提供しようとしている高度なモデリング機能を必要としているか?
我々は、意図的な単純なグラフでベンチマーク監査を行い、最後の1つか2つの項目から、数ホップの項目遷移グラフから候補を検索し、項目間類似度でランク付けする。
論文 参考訳(メタデータ) (2026-05-08T02:00:11Z) - TSAQA: Time Series Analysis Question And Answering Benchmark [85.35545785252309]
時系列データは、金融、医療、交通、環境科学といった分野における重要な応用に不可欠である。
TSAQAはタスクカバレッジを拡大し、多様な時間的分析能力を評価するために設計された新しい統合ベンチマークである。
論文 参考訳(メタデータ) (2026-01-30T17:28:56Z) - Chain-of-thought Reviewing and Correction for Time Series Question Answering [22.889720488678076]
本稿では,時系列質問応答の明示的な補正機構を備えた多段階推論を行うT3LLMを提案する。
このフレームワーク内では、作業者は構造化されたプロンプトの下で段階的思考連鎖(CoT)を生成し、レビュアーは推論を検査し、誤ったステップを特定し、修正的なコメントを提供する。
複数の実世界のTSQAベンチマークの実験により、T3LLMは強力なLLMベースのベースラインに対して最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-12-27T15:54:18Z) - TS-Agent: A Time Series Reasoning Agent with Iterative Statistical Insight Gathering [16.95452463476229]
大規模言語モデル(LLM)のための時系列推論エージェントTS-Agentを提案する。
時系列をテキストトークン、画像、埋め込みにマッピングする代わりに、我々のエージェントは原子演算子を介して生の数値列と相互作用する。
実験の結果,TS-Agent は理解ベンチマークの最先端 LLM に匹敵する性能を達成できた。
論文 参考訳(メタデータ) (2025-10-08T18:31:53Z) - TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models [105.47481207029047]
時系列を推論する3つの基本的な機能にまたがる4つのアトミックタスクを形式化した時系列推論スイート(TSR-Suite)を紹介する。
また,時系列推論を必要とする多種多様な実世界の問題に対処するために設計された最初の統一推論モデルであるTime Omni-1を紹介する。
論文 参考訳(メタデータ) (2025-09-29T13:54:34Z) - Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。
4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。
一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文 参考訳(メタデータ) (2025-08-05T12:52:09Z) - Domain-Oriented Time Series Inference Agents for Reasoning and Automated Analysis [19.649769354503658]
本稿では,自然言語推論と正確な数値実行を統合したドメイン指向時系列エージェントTS-Reasonerを紹介する。
基本時系列理解と複雑な多段階推論という2つの軸でその能力を評価する。
論文 参考訳(メタデータ) (2024-10-05T06:04:19Z) - Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを紹介する。
バスケットボールU,サッカーU,サッカーUの3つの実践的スポーツデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。