論文の概要: CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting
- arxiv url: http://arxiv.org/abs/2409.19058v2
- Date: Sun, 16 Feb 2025 10:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 20:34:44.379494
- Title: CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting
- Title(参考訳): CLLMate: 天気・気候予報イベントのマルチモーダルベンチマーク
- Authors: Haobo Li, Zhaowei Wang, Jiachen Wang, Yueya Wang, Alexis Kai Hon Lau, Huamin Qu,
- Abstract要約: 気象・気候イベント予測(WCEF)を提案し,気象・気候事象を予測する。
CLLMateは、26,156の環境ニュース記事とERA5の再分析データを用いたWCEFの最初のデータセットである。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
- 参考スコア(独自算出の注目度): 28.560095276214543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Forecasting weather and climate events is crucial for making appropriate measures to mitigate environmental hazards and minimize losses. However, existing environmental forecasting research focuses narrowly on predicting numerical meteorological variables (e.g., temperature), neglecting the translation of these variables into actionable textual narratives of events and their consequences. To bridge this gap, we proposed Weather and Climate Event Forecasting (WCEF), a new task that leverages numerical meteorological raster data and textual event data to predict weather and climate events. This task is challenging to accomplish due to difficulties in aligning multimodal data and the lack of supervised datasets. To address these challenges, we present CLLMate, the first multimodal dataset for WCEF, using 26,156 environmental news articles aligned with ERA5 reanalysis data. We systematically benchmark 23 existing MLLMs on CLLMate, including closed-source, open-source, and our fine-tuned models. Our experiments reveal the advantages and limitations of existing MLLMs and the value of CLLMate for the training and benchmarking of the WCEF task.
- Abstract(参考訳): 気象や気候の予報は、環境の危険を軽減し、損失を最小限に抑えるための適切な措置をとるために不可欠である。
しかし、既存の環境予測研究は、数値気象変数(例えば温度)の予測に焦点が当てられており、これらの変数をイベントの実行可能なテキスト物語に変換することは無視されている。
このギャップを埋めるため、気象・気候予報(WCEF)を提案しました。
このタスクは、マルチモーダルデータの整合と、教師付きデータセットの欠如のため、達成が難しい。
これらの課題に対処するために、ERA5の再解析データに適合した26,156の環境ニュース記事を用いて、WCEFのための最初のマルチモーダルデータセットであるCLLMateを提案する。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
実験の結果,既存のMLLMの利点と限界と,WCEFタスクのトレーニングとベンチマークのためのCLLMateの価値が明らかになった。
関連論文リスト
- ClimaEmpact: Domain-Aligned Small Language Models and Datasets for Extreme Weather Analytics [27.060978828050352]
大規模言語モデル(LLM)は、膨大な量の構造化されていないテキストデータを処理し、意味のある洞察を抽出し、詳細な評価を生成する。
LLMは、言語理解をより小さなモデルにシームレスに移行し、特定のタスクを微調整しながら重要な知識を保持することができる。
構造化推論経路を組み込んだ小型言語モデル(SLM)を強化する手法であるExtreme Weather Reasoning-Aware Alignment (EWRA)を提案する。
論文 参考訳(メタデータ) (2025-04-27T01:15:14Z) - ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.76389719956301]
我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。
また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文 参考訳(メタデータ) (2025-04-10T02:22:23Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Deep Learning for Weather Forecasting: A CNN-LSTM Hybrid Model for Predicting Historical Temperature Data [7.559331742876793]
本研究では,畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)を併用したハイブリッドモデルを提案する。
CNNは空間的特徴抽出に利用され、LSTMは時間的依存を処理し、予測精度と安定性が大幅に向上する。
論文 参考訳(メタデータ) (2024-10-19T03:38:53Z) - Weather Prediction Using CNN-LSTM for Time Series Analysis: A Case Study on Delhi Temperature Data [0.0]
本研究では,デリー地域の温度予測精度を高めるために,ハイブリッドCNN-LSTMモデルを提案する。
モデルの構築とトレーニングには,包括的データ前処理や探索分析など,直接的および間接的手法を併用した。
実験結果から,CNN-LSTMモデルが従来の予測手法よりも精度と安定性の両面で優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-09-14T11:06:07Z) - MambaDS: Near-Surface Meteorological Field Downscaling with Topography Constrained Selective State Space Modeling [68.69647625472464]
気象予測において重要な課題であるダウンスケーリングは、ターゲット領域に対する高解像度気象状態の再構築を可能にする。
以前のダウンスケーリング手法には気象学のための調整された設計が欠けており、構造的な限界に遭遇した。
本稿では,多変数相関と地形情報の利用性を高める新しいモデルであるMambaDSを提案する。
論文 参考訳(メタデータ) (2024-08-20T13:45:49Z) - Generating Fine-Grained Causality in Climate Time Series Data for Forecasting and Anomaly Detection [67.40407388422514]
我々は、TBN Granger Causalityという概念的微粒因果モデルを設計する。
次に, TBN Granger Causality を生成的に発見する TacSas という, エンドツーエンドの深部生成モデルを提案する。
気候予報のための気候指標ERA5と、極度気象警報のためのNOAAの極端気象基準でTacSasを試験する。
論文 参考訳(メタデータ) (2024-08-08T06:47:21Z) - MAVEN-Fact: A Large-scale Event Factuality Detection Dataset [55.01875707021496]
我々は,MAVENデータセットに基づく大規模かつ高品質なEFDデータセットであるMAVEN-Factを紹介する。
MAVEN-Factには112,276のイベントのファクトリティアノテーションが含まれており、EFDデータセットとしては最大である。
MAVEN-Factは従来の微調整モデルと大規模言語モデル(LLM)の両方において困難であることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-07-22T03:43:46Z) - A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0261082985087]
時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。
LLMの入力に生テキストを直接統合しても、ゼロショット補間性能は向上しないことがわかった。
対照的に、特定の複雑なイベントや微調整LDMに生テキストを組み込むことで、性能が大幅に向上する。
論文 参考訳(メタデータ) (2024-07-16T11:58:54Z) - Vision-Language Models Meet Meteorology: Developing Models for Extreme Weather Events Detection with Heatmaps [30.771706309741656]
極端な気象のリアルタイム検出と予測は、人間の生命とインフラを保護する。
従来の手法は地理情報システム(GIS)を用いた気象熱マップの数値しきい値設定と手動解釈に依存している。
本研究は,視覚質問応答 (VQA) 問題としてフレーミングすることで,極度気象事象検出 (EWED) を再定義する。
論文 参考訳(メタデータ) (2024-06-14T08:46:44Z) - Observation-Guided Meteorological Field Downscaling at Station Scale: A
Benchmark and a New Method [66.80344502790231]
気象学的ダウンスケーリングを任意の散乱ステーションスケールに拡張し、新しいベンチマークとデータセットを確立する。
データ同化技術にインスパイアされた我々は、観測データをダウンスケーリングプロセスに統合し、マルチスケールの観測先行情報を提供する。
提案手法は、複数の曲面変数上で、他の特別に設計されたベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2024-01-22T14:02:56Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - W-MAE: Pre-trained weather model with masked autoencoder for
multi-variable weather forecasting [7.610811907813171]
天気予報のための事前学習を行うMasked AutoEncoderを用いた気象モデルを提案する。
W-MAEは、気象変数内の空間的相関を再構成するために、自己教師付きで事前訓練される。
時間スケールでは、事前訓練されたW-MAEを微調整し、気象変数の将来状態を予測する。
論文 参考訳(メタデータ) (2023-04-18T06:25:11Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - RainBench: Towards Global Precipitation Forecasting from Satellite
Imagery [6.462260770989231]
極端に降水するイベントは、発展途上国の経済と生活を定期的に破壊する。
データ駆動型ディープラーニングアプローチは、正確な複数日予測へのアクセスを広げる可能性がある。
現在、世界的な降雨予測の研究に特化したベンチマークデータセットは存在しない。
論文 参考訳(メタデータ) (2020-12-17T15:35:24Z) - DeepClimGAN: A High-Resolution Climate Data Generator [60.59639064716545]
地球系モデル(ESM)は、気候変動シナリオの将来の予測を生成するためにしばしば用いられる。
妥協として、エミュレータはかなり安価であるが、ESMの複雑さを全て備えているわけではない。
本稿では, ESMエミュレータとして, 条件付き生成逆数ネットワーク(GAN)の使用を実証する。
論文 参考訳(メタデータ) (2020-11-23T20:13:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。