論文の概要: NSW-EPNews: A News-Augmented Benchmark for Electricity Price Forecasting with LLMs
- arxiv url: http://arxiv.org/abs/2506.11050v1
- Date: Thu, 22 May 2025 02:13:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.517869
- Title: NSW-EPNews: A News-Augmented Benchmark for Electricity Price Forecasting with LLMs
- Title(参考訳): NSW-EPNews: LLMによる電力価格予測のためのニュース強化ベンチマーク
- Authors: Zhaoge Bi, Linghan Huang, Haolin Jin, Qingwen Zeng, Huaming Chen,
- Abstract要約: NSW-EPNewsは,実世界の電力価格予測において時系列モデルと大規模言語モデル(LLM)を共同で評価する最初のベンチマークである。
データセットには、ニューサウスウェールズ州(2015-2024)から17万5000時間以上のスポット価格、毎日の温度測定、WattClarityからのマーケットニューズサマリーのキュレーションが含まれている。
- 参考スコア(独自算出の注目度): 0.5172964916120903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electricity price forecasting is a critical component of modern energy-management systems, yet existing approaches heavily rely on numerical histories and ignore contemporaneous textual signals. We introduce NSW-EPNews, the first benchmark that jointly evaluates time-series models and large language models (LLMs) on real-world electricity-price prediction. The dataset includes over 175,000 half-hourly spot prices from New South Wales, Australia (2015-2024), daily temperature readings, and curated market-news summaries from WattClarity. We frame the task as 48-step-ahead forecasting, using multimodal input, including lagged prices, vectorized news and weather features for classical models, and prompt-engineered structured contexts for LLMs. Our datasets yields 3.6k multimodal prompt-output pairs for LLM evaluation using specific templates. Through compresive benchmark design, we identify that for traditional statistical and machine learning models, the benefits gain is marginal from news feature. For state-of-the-art LLMs, such as GPT-4o and Gemini 1.5 Pro, we observe modest performance increase while it also produce frequent hallucinations such as fabricated and malformed price sequences. NSW-EPNews provides a rigorous testbed for evaluating grounded numerical reasoning in multimodal settings, and highlights a critical gap between current LLM capabilities and the demands of high-stakes energy forecasting.
- Abstract(参考訳): 電力価格予測は、現代のエネルギー管理システムにおいて重要な要素であるが、既存のアプローチは数値履歴に大きく依存し、同時期のテキスト信号を無視している。
NSW-EPNewsは,実世界の電力価格予測において時系列モデルと大規模言語モデル(LLM)を共同で評価する最初のベンチマークである。
データセットには、ニューサウスウェールズ州(2015-2024)から17万5000時間以上のスポット価格、毎日の温度測定、WattClarityからのマーケットニューズサマリーのキュレーションが含まれている。
タスクを48段階の予測として、ラグ価格、古典モデルのベクトル化ニュースと天気特徴、LLMのプロンプトエンジニアリングによる構造化コンテキストなどのマルチモーダル入力を用いて構成する。
我々のデータセットは、特定のテンプレートを用いたLCM評価のための3.6kのマルチモーダル・プロンプト・アウトプットペアを生成する。
理解的なベンチマーク設計を通じて、従来の統計モデルや機械学習モデルでは、ニュース機能から得られるメリットが限界があることを識別する。
GPT-4o や Gemini 1.5 Pro のような最先端の LLM では、モデストな性能向上と、製造や不正な価格系列などの頻繁な幻覚を観測する。
NSW-EPNewsは、マルチモーダル環境での接地された数値推論を評価するための厳密なテストベッドを提供する。
関連論文リスト
- Benchmarking Pre-Trained Time Series Models for Electricity Price Forecasting [1.1557852082644071]
我々は、電力価格予測のための確立された統計および機械学習(ML)手法に対して、最先端の事前訓練モデルをいくつかベンチマークする。
ドイツ、フランス、オランダ、オーストリア、ベルギーの2024日の日頭オークション(DAA)の電力価格を用いて、1日当たりの予想を下方修正する。
Chronos-BoltとTime-MoEはTSFMの中でも最強で、従来のモデルと同等のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-06-09T18:10:00Z) - Efficient Model Selection for Time Series Forecasting via LLMs [52.31535714387368]
本稿では,Large Language Models (LLM) をモデル選択の軽量な代替手段として活用することを提案する。
提案手法は, LLMの固有知識と推論能力を活用することで, 明示的な性能行列の必要性を解消する。
論文 参考訳(メタデータ) (2025-04-02T20:33:27Z) - BreakGPT: Leveraging Large Language Models for Predicting Asset Price Surges [55.2480439325792]
本稿では,時系列予測や資産価格の急上昇の予測に特化して,新たな大規模言語モデル(LLM)アーキテクチャであるBreakGPTを紹介する。
我々は、最小限のトレーニングで財務予測を行うための有望なソリューションとしてBreakGPTを紹介し、局所的およびグローバルな時間的依存関係をキャプチャする強力な競合相手として紹介する。
論文 参考訳(メタデータ) (2024-11-09T05:40:32Z) - CALF: Aligning LLMs for Time Series Forecasting via Cross-modal Fine-Tuning [59.88924847995279]
MTSFのためのクロスモーダルLCMファインチューニング(CALF)フレームワークを提案する。
分散の相違を低減するため,クロスモーダルマッチングモジュールを開発した。
CALFは、長期および短期の予測タスクの最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2024-03-12T04:04:38Z) - How Easy is It to Fool Your Multimodal LLMs? An Empirical Analysis on Deceptive Prompts [54.07541591018305]
提案するMAD-Benchは,既存のオブジェクト,オブジェクト数,空間関係などの5つのカテゴリに分割した1000の試験サンプルを含むベンチマークである。
我々は,GPT-4v,Reka,Gemini-Proから,LLaVA-NeXTやMiniCPM-Llama3といったオープンソースモデルに至るまで,一般的なMLLMを包括的に分析する。
GPT-4oはMAD-Bench上で82.82%の精度を達成するが、実験中の他のモデルの精度は9%から50%である。
論文 参考訳(メタデータ) (2024-02-20T18:31:27Z) - A probabilistic forecast methodology for volatile electricity prices in
the Australian National Electricity Market [0.36832029288386137]
オーストラリア国定電力市場(Australian National Electricity Market)の南オーストラリア地域は、現代の電力市場において最も高い価格変動率を示している。
本稿では,これらの極端条件下での確率予測へのアプローチについて概説する。
論文 参考訳(メタデータ) (2023-11-13T12:33:33Z) - AI Driven Near Real-time Locational Marginal Pricing Method: A
Feasibility and Robustness Study [0.6144680854063939]
ロケーション・マージナル・プライシング (Locational Marginal Pricing, LMP) は、現代の多くの電力市場で使われている。
大規模な電力網では、このプロセスは違法な時間と計算集約となる。
本研究では、複数の電力網上でのLMP予測において、一般的な機械学習モデルとディープラーニングモデルの性能を評価する。
論文 参考訳(メタデータ) (2023-06-16T06:41:04Z) - A comparative assessment of deep learning models for day-ahead load
forecasting: Investigating key accuracy drivers [2.572906392867547]
短期負荷予測(STLF)は電力グリッドとエネルギー市場の効果的かつ経済的な運用に不可欠である。
STLFの文献ではいくつかのディープラーニングモデルが提案されており、有望な結果を報告している。
論文 参考訳(メタデータ) (2023-02-23T17:11:04Z) - You can't pick your neighbors, or can you? When and how to rely on
retrieval in the $k$NN-LM [65.74934004876914]
Retrieval-enhanced Language Model (LM) は、大規模な外部データストアから取得したテキストにそれらの予測を条件付ける。
そのようなアプローチの1つ、$k$NN-LMは、既存のLMの予測を$k$-nearest近くのモデルの出力と補間する。
本研究では,2つの英語モデルデータセットに対するアプローチの有効性を実証的に測定する。
論文 参考訳(メタデータ) (2022-10-28T02:57:40Z) - A Hybrid Model for Forecasting Short-Term Electricity Demand [59.372588316558826]
現在、英国電気市場は、規制当局が30分毎に発行する負荷(需要)予測によってガイドされている。
本稿では,機能工学(候補予測機能の選択),移動ウィンドウ予測,LSTMエンコーダデコーダを組み合わせたハイブリッド予測モデルHYENAを提案する。
論文 参考訳(メタデータ) (2022-05-20T22:13:25Z) - Deep Learning Approaches for Forecasting Strawberry Yields and Prices
Using Satellite Images and Station-Based Soil Parameters [2.3513645401551333]
本稿では,カリフォルニア州サンタバーバラ郡のイチゴ収量と価格を予測するためのディープラーニングアルゴリズムに基づく代替手法を提案する。
提案する予測モデルの構築には3つの段階がある: まず, 複雑な深層学習成分を用いた局型アンサンブルモデル(ATT-CNN-LSTM-SeriesNet_Ens)。
第2に, リモートセンシングアンサンブルモデル (SIM_CNN-LSTM_Ens) を, 出力と同じ収量と価格にマッピングされた入力と同じ郡の衛星画像を用いて訓練し, テストする。
第三に、これらの2つのモデルの予測は最終的な予測値にまとめられる。
論文 参考訳(メタデータ) (2021-02-17T20:54:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。