論文の概要: TS-Arena Technical Report -- A Pre-registered Live Forecasting Platform
- arxiv url: http://arxiv.org/abs/2512.20761v1
- Date: Tue, 23 Dec 2025 20:48:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.597013
- Title: TS-Arena Technical Report -- A Pre-registered Live Forecasting Platform
- Title(参考訳): TS-Arena Technical Report - 登録済みのライブストリーミングプラットフォーム
- Authors: Marcel Meyer, Sascha Kaltenpoth, Kevin Zalipski, Henrik Albers, Oliver Müller,
- Abstract要約: 時系列ファンデーションモデル(TSFM)は、予測のための変換機能を提供するが、リスクは基本的な評価危機を引き起こす。
この危機は、異なるモデルにまたがるトレーニングとテストセットの重複による情報漏洩と、テストデータへのグローバルパターンの不正な転送によって引き起こされる。
TS-Arenaは、真に未知の未来を決定的なテスト環境として扱うことにより、予測の運用上の整合性を回復するプラットフォームである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Time Series Foundation Models (TSFMs) offer transformative capabilities for forecasting, they simultaneously risk triggering a fundamental evaluation crisis. This crisis is driven by information leakage due to overlapping training and test sets across different models, as well as the illegitimate transfer of global patterns to test data. While the ability to learn shared temporal dynamics represents a primary strength of these models, their evaluation on historical archives often permits the exploitation of observed global shocks, which violates the independence required for valid benchmarking. We introduce TS-Arena, a platform that restores the operational integrity of forecasting by treating the genuinely unknown future as the definitive test environment. By implementing a pre-registration mechanism on live data streams, the platform ensures that evaluation targets remain physically non-existent during inference, thereby enforcing a strict global temporal split. This methodology establishes a moving temporal frontier that prevents historical contamination and provides an authentic assessment of model generalization. Initially applied within the energy sector, TS-Arena provides a sustainable infrastructure for comparing foundation models under real-world constraints. A prototype of the platform is available at https://huggingface.co/spaces/DAG-UPB/TS-Arena.
- Abstract(参考訳): Time Series Foundation Models (TSFMs) は予測にトランスフォーメーション機能を提供する一方で、基本的な評価危機を引き起こすリスクを同時に引き起こす。
この危機は、異なるモデルにまたがるトレーニングとテストセットの重複による情報漏洩と、テストデータへのグローバルパターンの不正な転送によって引き起こされる。
共有時間力学を学習する能力はこれらのモデルの主要な強みであるが、歴史的アーカイブでの彼らの評価は、しばしば観測されたグローバルショックの活用を許し、これは有効なベンチマークに必要な独立性に反する。
TS-Arenaは、真に未知の未来を決定的なテスト環境として扱うことにより、予測の運用上の整合性を回復するプラットフォームである。
ライブデータストリームに事前登録機構を実装することにより,評価対象が推論中に物理的に存在しないことを保証し,厳密なグローバル時間分割を実現する。
この手法は、歴史的汚染を防止し、モデル一般化の真正性評価を提供する移動時空フロンティアを確立する。
当初、TS-Arenaは、現実の制約の下で基礎モデルを比較するための持続可能なインフラを提供する。
プラットフォームのプロトタイプはhttps://huggingface.co/spaces/DAG-UPB/TS-Arenaで公開されている。
関連論文リスト
- Time Series Foundation Models: Benchmarking Challenges and Requirements [0.0]
時系列基礎モデル(TSFM)は、時系列予測の新しいパラダイムである。
TSFMの評価は、より広範なトレーニングセットと同様に、整合性ベンチマークデータの確保がより困難になるため、難しい。
論文 参考訳(メタデータ) (2025-10-15T15:15:45Z) - Are Large Reasoning Models Interruptible? [77.53059044071107]
LRM(Large Reasoning Models)は複雑な推論において優れているが、伝統的に静的な「凍った世界」設定で評価されている。
静的な設定で高い精度を達成できる最先端のLEMでさえ、割り込みやコンテキストの変化に晒された場合、予測不能に失敗する可能性があることを示す。
我々の分析ではさらに、漏れの原因、パニック、自己疑念など、いくつかの新しい障害モードを明らかにしている。
論文 参考訳(メタデータ) (2025-10-13T17:59:35Z) - DAWP: A framework for global observation forecasting via Data Assimilation and Weather Prediction in satellite observation space [60.729377189859]
完全な観測空間でAIWPを動作させるためのDAWPフレームワークを提案する。
AIDAモジュールは、不規則な衛星観測トークンを同化するためにマスク多モードオートエンコーダを適用している。
我々はAIDAがAIWPのロールアウトと効率を大幅に改善し、地球規模の降水分解予測に適用できる有望な可能性を秘めていることを示す。
論文 参考訳(メタデータ) (2025-10-13T03:13:35Z) - Appa: Bending Weather Dynamics with Latent Diffusion Models for Global Data Assimilation [4.430758443755128]
Appaはスコアベースのデータ同化モデルで、地球規模の大気軌道を0.25度と1時間間隔で生成する。
この結果から,将来的な大気モデルシステムの基礎として,潜在スコアに基づくデータ同化が確立される。
論文 参考訳(メタデータ) (2025-04-25T22:14:29Z) - Federated Dynamic Modeling and Learning for Spatiotemporal Data Forecasting [1.492694722803554]
本稿では,複雑な時間的データを予測するための高度なフェデレート学習(FL)フレームワークを提案する。
Gated Recurrent Unit(RU)モジュールをLong Short-Term Memory(LSTM)ネットワークに置き換える。
結果として生じるアーキテクチャは、様々な予測アプリケーションで複雑な時間パターンを扱う能力を大幅に改善します。
論文 参考訳(メタデータ) (2025-03-06T15:16:57Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Weather Prediction with Diffusion Guided by Realistic Forecast Processes [49.07556359513563]
気象予報に拡散モデル(DM)を適用した新しい手法を提案する。
提案手法は,同一のモデリングフレームワークを用いて,直接予測と反復予測の両方を実現できる。
我々のモデルの柔軟性と制御性は、一般の気象コミュニティにとってより信頼性の高いDLシステムに力を与えます。
論文 参考訳(メタデータ) (2024-02-06T21:28:42Z) - Towards an end-to-end artificial intelligence driven global weather forecasting system [57.5191940978886]
我々は,地球規模の気象変動に対するAIに基づくデータ同化モデル,すなわちAdasを提案する。
我々は,アダスが地球観測を同化して高品質な分析を行い,長期にわたって安定して運用できることを実証した。
この手法を現実のシナリオに適用するのは,私たちが初めてです。
論文 参考訳(メタデータ) (2023-12-18T09:05:28Z) - PriSTI: A Conditional Diffusion Framework for Spatiotemporal Imputation [35.62945607302276]
本稿では,PriSTI という先行モデルを用いた時空間計算のための条件拡散フレームワークを提案する。
PriSTIは、さまざまな現実世界データの欠落パターンにおいて既存の計算方法よりも優れており、高い欠落率やセンサーの故障といったシナリオを効果的に処理する。
論文 参考訳(メタデータ) (2023-02-20T03:52:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。