論文の概要: CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting
- arxiv url: http://arxiv.org/abs/2409.19058v2
- Date: Sun, 16 Feb 2025 10:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:07:32.026794
- Title: CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting
- Title(参考訳): CLLMate: 天気・気候予報イベントのマルチモーダルベンチマーク
- Authors: Haobo Li, Zhaowei Wang, Jiachen Wang, Yueya Wang, Alexis Kai Hon Lau, Huamin Qu,
- Abstract要約: 気象・気候イベント予測(WCEF)を提案し,気象・気候事象を予測する。
CLLMateは、26,156の環境ニュース記事とERA5の再分析データを用いたWCEFの最初のデータセットである。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
- 参考スコア(独自算出の注目度): 28.560095276214543
- License:
- Abstract: Forecasting weather and climate events is crucial for making appropriate measures to mitigate environmental hazards and minimize losses. However, existing environmental forecasting research focuses narrowly on predicting numerical meteorological variables (e.g., temperature), neglecting the translation of these variables into actionable textual narratives of events and their consequences. To bridge this gap, we proposed Weather and Climate Event Forecasting (WCEF), a new task that leverages numerical meteorological raster data and textual event data to predict weather and climate events. This task is challenging to accomplish due to difficulties in aligning multimodal data and the lack of supervised datasets. To address these challenges, we present CLLMate, the first multimodal dataset for WCEF, using 26,156 environmental news articles aligned with ERA5 reanalysis data. We systematically benchmark 23 existing MLLMs on CLLMate, including closed-source, open-source, and our fine-tuned models. Our experiments reveal the advantages and limitations of existing MLLMs and the value of CLLMate for the training and benchmarking of the WCEF task.
- Abstract(参考訳): 気象や気候の予報は、環境の危険を軽減し、損失を最小限に抑えるための適切な措置をとるために不可欠である。
しかし、既存の環境予測研究は、数値気象変数(例えば温度)の予測に焦点が当てられており、これらの変数をイベントの実行可能なテキスト物語に変換することは無視されている。
このギャップを埋めるため、気象・気候予報(WCEF)を提案しました。
このタスクは、マルチモーダルデータの整合と、教師付きデータセットの欠如のため、達成が難しい。
これらの課題に対処するために、ERA5の再解析データに適合した26,156の環境ニュース記事を用いて、WCEFのための最初のマルチモーダルデータセットであるCLLMateを提案する。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
実験の結果,既存のMLLMの利点と限界と,WCEFタスクのトレーニングとベンチマークのためのCLLMateの価値が明らかになった。
関連論文リスト
- TimeCAP: Learning to Contextualize, Augment, and Predict Time Series Events with Large Language Model Agents [52.13094810313054]
TimeCAPは、時系列データのコンテキスト化ツールとしてLarge Language Models(LLM)を創造的に利用する時系列処理フレームワークである。
TimeCAPには2つの独立したLCMエージェントが組み込まれており、1つは時系列のコンテキストをキャプチャするテキスト要約を生成し、もう1つはより情報のある予測を行うためにこのリッチな要約を使用する。
実世界のデータセットによる実験結果から,TimeCAPは時系列イベント予測の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-17T04:17:27Z) - Accurate Prediction of Temperature Indicators in Eastern China Using a Multi-Scale CNN-LSTM-Attention model [0.0]
マルチスケールの畳み込み型CNN-LSTM-Attentionアーキテクチャに基づく天気予報モデルを提案する。
このモデルは、畳み込みニューラルネットワーク(CNN)、Long Short-Term Memory(LSTM)ネットワーク、およびアテンションメカニズムを統合している。
実験結果から, モデルが高精度に温度変動を予測できることが示唆された。
論文 参考訳(メタデータ) (2024-12-11T00:42:31Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Deep Learning for Weather Forecasting: A CNN-LSTM Hybrid Model for Predicting Historical Temperature Data [7.559331742876793]
本研究では,畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)を併用したハイブリッドモデルを提案する。
CNNは空間的特徴抽出に利用され、LSTMは時間的依存を処理し、予測精度と安定性が大幅に向上する。
論文 参考訳(メタデータ) (2024-10-19T03:38:53Z) - Weather Prediction Using CNN-LSTM for Time Series Analysis: A Case Study on Delhi Temperature Data [0.0]
本研究では,デリー地域の温度予測精度を高めるために,ハイブリッドCNN-LSTMモデルを提案する。
モデルの構築とトレーニングには,包括的データ前処理や探索分析など,直接的および間接的手法を併用した。
実験結果から,CNN-LSTMモデルが従来の予測手法よりも精度と安定性の両面で優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-09-14T11:06:07Z) - MAVEN-Fact: A Large-scale Event Factuality Detection Dataset [55.01875707021496]
我々は,MAVENデータセットに基づく大規模かつ高品質なEFDデータセットであるMAVEN-Factを紹介する。
MAVEN-Factには112,276のイベントのファクトリティアノテーションが含まれており、EFDデータセットとしては最大である。
MAVEN-Factは従来の微調整モデルと大規模言語モデル(LLM)の両方において困難であることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-07-22T03:43:46Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - W-MAE: Pre-trained weather model with masked autoencoder for
multi-variable weather forecasting [7.610811907813171]
天気予報のための事前学習を行うMasked AutoEncoderを用いた気象モデルを提案する。
W-MAEは、気象変数内の空間的相関を再構成するために、自己教師付きで事前訓練される。
時間スケールでは、事前訓練されたW-MAEを微調整し、気象変数の将来状態を予測する。
論文 参考訳(メタデータ) (2023-04-18T06:25:11Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - RainBench: Towards Global Precipitation Forecasting from Satellite
Imagery [6.462260770989231]
極端に降水するイベントは、発展途上国の経済と生活を定期的に破壊する。
データ駆動型ディープラーニングアプローチは、正確な複数日予測へのアクセスを広げる可能性がある。
現在、世界的な降雨予測の研究に特化したベンチマークデータセットは存在しない。
論文 参考訳(メタデータ) (2020-12-17T15:35:24Z) - DeepClimGAN: A High-Resolution Climate Data Generator [60.59639064716545]
地球系モデル(ESM)は、気候変動シナリオの将来の予測を生成するためにしばしば用いられる。
妥協として、エミュレータはかなり安価であるが、ESMの複雑さを全て備えているわけではない。
本稿では, ESMエミュレータとして, 条件付き生成逆数ネットワーク(GAN)の使用を実証する。
論文 参考訳(メタデータ) (2020-11-23T20:13:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。