論文の概要: CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting
- arxiv url: http://arxiv.org/abs/2409.19058v2
- Date: Sun, 16 Feb 2025 10:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:07:32.026794
- Title: CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting
- Title(参考訳): CLLMate: 天気・気候予報イベントのマルチモーダルベンチマーク
- Authors: Haobo Li, Zhaowei Wang, Jiachen Wang, Yueya Wang, Alexis Kai Hon Lau, Huamin Qu,
- Abstract要約: 気象・気候イベント予測(WCEF)を提案し,気象・気候事象を予測する。
CLLMateは、26,156の環境ニュース記事とERA5の再分析データを用いたWCEFの最初のデータセットである。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
- 参考スコア(独自算出の注目度): 28.560095276214543
- License:
- Abstract: Forecasting weather and climate events is crucial for making appropriate measures to mitigate environmental hazards and minimize losses. However, existing environmental forecasting research focuses narrowly on predicting numerical meteorological variables (e.g., temperature), neglecting the translation of these variables into actionable textual narratives of events and their consequences. To bridge this gap, we proposed Weather and Climate Event Forecasting (WCEF), a new task that leverages numerical meteorological raster data and textual event data to predict weather and climate events. This task is challenging to accomplish due to difficulties in aligning multimodal data and the lack of supervised datasets. To address these challenges, we present CLLMate, the first multimodal dataset for WCEF, using 26,156 environmental news articles aligned with ERA5 reanalysis data. We systematically benchmark 23 existing MLLMs on CLLMate, including closed-source, open-source, and our fine-tuned models. Our experiments reveal the advantages and limitations of existing MLLMs and the value of CLLMate for the training and benchmarking of the WCEF task.
- Abstract(参考訳): 気象や気候の予報は、環境の危険を軽減し、損失を最小限に抑えるための適切な措置をとるために不可欠である。
しかし、既存の環境予測研究は、数値気象変数(例えば温度)の予測に焦点が当てられており、これらの変数をイベントの実行可能なテキスト物語に変換することは無視されている。
このギャップを埋めるため、気象・気候予報(WCEF)を提案しました。
このタスクは、マルチモーダルデータの整合と、教師付きデータセットの欠如のため、達成が難しい。
これらの課題に対処するために、ERA5の再解析データに適合した26,156の環境ニュース記事を用いて、WCEFのための最初のマルチモーダルデータセットであるCLLMateを提案する。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
実験の結果,既存のMLLMの利点と限界と,WCEFタスクのトレーニングとベンチマークのためのCLLMateの価値が明らかになった。
関連論文リスト
- Deep Learning for Weather Forecasting: A CNN-LSTM Hybrid Model for Predicting Historical Temperature Data [7.559331742876793]
本研究では,畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)を併用したハイブリッドモデルを提案する。
CNNは空間的特徴抽出に利用され、LSTMは時間的依存を処理し、予測精度と安定性が大幅に向上する。
論文 参考訳(メタデータ) (2024-10-19T03:38:53Z) - MambaDS: Near-Surface Meteorological Field Downscaling with Topography Constrained Selective State Space Modeling [68.69647625472464]
気象予測において重要な課題であるダウンスケーリングは、ターゲット領域に対する高解像度気象状態の再構築を可能にする。
以前のダウンスケーリング手法には気象学のための調整された設計が欠けており、構造的な限界に遭遇した。
本稿では,多変数相関と地形情報の利用性を高める新しいモデルであるMambaDSを提案する。
論文 参考訳(メタデータ) (2024-08-20T13:45:49Z) - Generating Fine-Grained Causality in Climate Time Series Data for Forecasting and Anomaly Detection [67.40407388422514]
我々は、TBN Granger Causalityという概念的微粒因果モデルを設計する。
次に, TBN Granger Causality を生成的に発見する TacSas という, エンドツーエンドの深部生成モデルを提案する。
気候予報のための気候指標ERA5と、極度気象警報のためのNOAAの極端気象基準でTacSasを試験する。
論文 参考訳(メタデータ) (2024-08-08T06:47:21Z) - A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0261082985087]
時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。
LLMの入力に生テキストを直接統合しても、ゼロショット補間性能は向上しないことがわかった。
対照的に、特定の複雑なイベントや微調整LDMに生テキストを組み込むことで、性能が大幅に向上する。
論文 参考訳(メタデータ) (2024-07-16T11:58:54Z) - Vision-Language Models Meet Meteorology: Developing Models for Extreme Weather Events Detection with Heatmaps [30.771706309741656]
極端な気象のリアルタイム検出と予測は、人間の生命とインフラを保護する。
従来の手法は地理情報システム(GIS)を用いた気象熱マップの数値しきい値設定と手動解釈に依存している。
本研究は,視覚質問応答 (VQA) 問題としてフレーミングすることで,極度気象事象検出 (EWED) を再定義する。
論文 参考訳(メタデータ) (2024-06-14T08:46:44Z) - Observation-Guided Meteorological Field Downscaling at Station Scale: A
Benchmark and a New Method [66.80344502790231]
気象学的ダウンスケーリングを任意の散乱ステーションスケールに拡張し、新しいベンチマークとデータセットを確立する。
データ同化技術にインスパイアされた我々は、観測データをダウンスケーリングプロセスに統合し、マルチスケールの観測先行情報を提供する。
提案手法は、複数の曲面変数上で、他の特別に設計されたベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2024-01-22T14:02:56Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - RainBench: Towards Global Precipitation Forecasting from Satellite
Imagery [6.462260770989231]
極端に降水するイベントは、発展途上国の経済と生活を定期的に破壊する。
データ駆動型ディープラーニングアプローチは、正確な複数日予測へのアクセスを広げる可能性がある。
現在、世界的な降雨予測の研究に特化したベンチマークデータセットは存在しない。
論文 参考訳(メタデータ) (2020-12-17T15:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。