論文の概要: Energy-Arena: A Dynamic Benchmark for Operational Energy Forecasting
- arxiv url: http://arxiv.org/abs/2604.24705v1
- Date: Mon, 27 Apr 2026 17:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.259284
- Title: Energy-Arena: A Dynamic Benchmark for Operational Energy Forecasting
- Title(参考訳): Energy-Arena: 運用エネルギー予測のための動的ベンチマーク
- Authors: Max Kleinebrahm, Jonathan Berrisch, Philipp Eiser, Wolf Fichtner, Veit Hagenmeyer, Matthias Hertel, Nils Koster, Sebastian Lerch, Ralf Mikut, Jan Priesmann, Melanie Schienle, Benjamin Schaefer, Jann Weinand, Florian Ziel,
- Abstract要約: 本稿では,運用エネルギー時系列予測のための動的ベンチマークプラットフォームであるEnergy-Arenaを紹介する。
振り返りのバックテストから前方のベンチマークに移行することで、Energy-Arenaは標準化されたex-anteの提出とex-post評価を実施する。
- 参考スコア(独自算出の注目度): 1.7225327025457389
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Energy forecasting research faces a persistent comparability gap that makes it difficult to measure consistent progress over time. Reported accuracy gains are often not directly comparable because models are evaluated under study-specific datasets, time periods, information sets, and scoring setups, while widely used benchmarks and competition datasets are typically tied to fixed historical windows. This paper introduces the Energy-Arena, a dynamic benchmarking platform for operational energy time series forecasting that provides a continuously updated reference point as energy systems evolve. The platform operates as an open, API-based submission system and standardizes challenge definitions and submission deadlines aligned with operational constraints. Performance is reported on rolling evaluation windows via persistent leaderboards. By moving from retrospective backtesting to forward-looking benchmarking, the Energy-Arena enforces standardized ex-ante submission and ex-post evaluation, thereby improving transparency by preventing information leakage and retroactive tuning. The platform is publicly available at Energy-Arena.org.
- Abstract(参考訳): エネルギー予測研究は、時間とともに一貫した進捗を測定するのが困難になる永続的な可視性ギャップに直面している。
モデルが研究固有のデータセット、時間、情報セット、スコアリング設定の下で評価されるのに対して、広く使用されているベンチマークと競合データセットは一般的に固定された歴史的なウィンドウに結び付けられているため、報告された精度の上昇は直接的に比較されないことが多い。
本稿では,エネルギーシステムの進化に伴う参照ポイントを継続的に更新する,運用エネルギー時系列予測のための動的ベンチマークプラットフォームであるEnergy-Arenaを紹介する。
プラットフォームはオープンなAPIベースのサブミッションシステムとして動作し、運用上の制約に従ってチャレンジ定義と提出期限を標準化する。
永続的なリーダボードを通じて、ローリング評価ウィンドウのパフォーマンスが報告されている。
ふりかえりのバックテストから前方のベンチマークに移行することで、Energy-Arenaは標準化されたex-anteの提出とポスト評価を強制し、情報漏洩や遡及的なチューニングを防止して透明性を向上させる。
このプラットフォームはEnergy-Arena.orgで公開されている。
関連論文リスト
- FRESCO: Benchmarking and Optimizing Re-rankers for Evolving Semantic Conflict in Retrieval-Augmented Generation [73.22935457705057]
時間的動的文脈における再ランカ評価のためのベンチマークであるFRESCOを紹介する。
レクエンシ検索クエリと過去のウィキペディアのリビジョンを組み合わせることで、FRESCOは、セマンティックな関連性を維持しながら、リランカが事実として最新の証拠を優先順位付けできるかどうかをテストする。
我々の評価では、既存の再ランカ間で一貫した障害モードが明らかになっている。
論文 参考訳(メタデータ) (2026-04-14T17:04:25Z) - Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting [8.050703449557028]
Impermanentは、オープンワールドの時間的変化の下で予測モデルを評価するライブベンチマークである。
私たちは、スター数によるトップ400リポジトリにフォーカスし、イシューのオープン、プルリクエストのオープン、プッシュイベント、新しいスターゲイザーから時系列を構築します。
静的な精度から持続的な性能へ評価をシフトさせることにより、Imbermanentは、時系列予測における基礎レベルの一般化が有意義に主張できるかどうかを評価するための具体的な一歩を踏み出す。
論文 参考訳(メタデータ) (2026-03-09T17:59:00Z) - It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks [87.7937890373758]
時系列基礎モデル(TSFM)は,特定のデータセットモデルから一般化可能なタスク評価に至るまで,予測環境に革命をもたらしている。
我々は、50の新しいデータセットと98の予測タスクからなる次世代タスク中心のベンチマークであるTIMEを紹介する。
静的なメタラベルに基づく従来のデータセットレベルの評価を超える新しいパターンレベルの評価視点を提案する。
論文 参考訳(メタデータ) (2026-02-12T16:31:01Z) - TS-Arena Technical Report -- A Pre-registered Live Forecasting Platform [0.0]
時系列ファンデーションモデル(TSFM)は、予測のための変換機能を提供するが、リスクは基本的な評価危機を引き起こす。
この危機は、異なるモデルにまたがるトレーニングとテストセットの重複による情報漏洩と、テストデータへのグローバルパターンの不正な転送によって引き起こされる。
TS-Arenaは、真に未知の未来を決定的なテスト環境として扱うことにより、予測の運用上の整合性を回復するプラットフォームである。
論文 参考訳(メタデータ) (2025-12-23T20:48:11Z) - Evaluating End-User Device Energy Models in Sustainability Reporting of Browser-Based Web Services [0.0]
ウェブベースのサービスのサステナビリティレポートは、単純化されたエネルギーと炭素モデルに依存している。
本稿では,そのようなモデルが実際のエネルギー消費をいかに反映しているかを実証研究する。
その結果, 一般に適用されている定電力近似は, 測定エネルギーから大きく逸脱する可能性が示唆された。
論文 参考訳(メタデータ) (2025-10-14T14:25:26Z) - Estimating Time Series Foundation Model Transferability via In-Context Learning [74.65355820906355]
時系列基礎モデル(TSFM)は、大規模な事前訓練を通じて強力なゼロショット予測を提供する。
微調整は、公開データに制限のあるドメインのパフォーマンス向上に依然として不可欠である。
モデル選択をコンテキスト内学習問題として再キャストする転送可能性推定フレームワークであるTimeTicを紹介する。
論文 参考訳(メタデータ) (2025-09-28T07:07:13Z) - Powerformer: A Transformer with Weighted Causal Attention for Time-series Forecasting [50.298817606660826]
我々は,非因果重みをスムーズな重み付き崩壊に応じて再加重する因果重みに置き換える新しいトランスフォーマーであるPowerformerを紹介する。
我々の実証実験の結果,Powerformer は公開時系列ベンチマークで最先端の精度を達成できた。
分析の結果、トレーニング中にモデルの局所性バイアスが増幅され、時系列データとパワールールに基づく注意の相互作用が示されることがわかった。
論文 参考訳(メタデータ) (2025-02-10T04:42:11Z) - OrionBench: Benchmarking Time Series Generative Models in the Service of the End-User [8.05635934199494]
OrionBenchは、教師なし時系列異常検出モデルのための継続的ベンチマークフレームワークである。
OrionBenchの使用方法と,4年間で公開された17リリースにわたるパイプラインのパフォーマンスについて紹介する。
論文 参考訳(メタデータ) (2023-10-26T19:43:16Z) - Benchmarks and Custom Package for Energy Forecasting [55.460452605056894]
エネルギー予測は、電力グリッドディスパッチのようなその後のタスクのコストを最小化することを目的としている。
本稿では,大規模負荷データセットを収集し,再生可能エネルギーデータセットを新たにリリースした。
評価指標の異なるレベルにおいて,21種類の予測手法を用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-07-14T06:50:02Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。