論文の概要: ClimaEmpact: Domain-Aligned Small Language Models and Datasets for Extreme Weather Analytics
- arxiv url: http://arxiv.org/abs/2504.19066v1
- Date: Sun, 27 Apr 2025 01:15:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.117785
- Title: ClimaEmpact: Domain-Aligned Small Language Models and Datasets for Extreme Weather Analytics
- Title(参考訳): ClimaEmpact:極端気象分析のためのドメイン指向小言語モデルとデータセット
- Authors: Deeksha Varshney, Keane Ong, Rui Mao, Erik Cambria, Gianmarco Mengaldo,
- Abstract要約: 大規模言語モデル(LLM)は、膨大な量の構造化されていないテキストデータを処理し、意味のある洞察を抽出し、詳細な評価を生成する。
LLMは、言語理解をより小さなモデルにシームレスに移行し、特定のタスクを微調整しながら重要な知識を保持することができる。
構造化推論経路を組み込んだ小型言語モデル(SLM)を強化する手法であるExtreme Weather Reasoning-Aware Alignment (EWRA)を提案する。
- 参考スコア(独自算出の注目度): 27.060978828050352
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate assessments of extreme weather events are vital for research and policy, yet localized and granular data remain scarce in many parts of the world. This data gap limits our ability to analyze potential outcomes and implications of extreme weather events, hindering effective decision-making. Large Language Models (LLMs) can process vast amounts of unstructured text data, extract meaningful insights, and generate detailed assessments by synthesizing information from multiple sources. Furthermore, LLMs can seamlessly transfer their general language understanding to smaller models, enabling these models to retain key knowledge while being fine-tuned for specific tasks. In this paper, we propose Extreme Weather Reasoning-Aware Alignment (EWRA), a method that enhances small language models (SLMs) by incorporating structured reasoning paths derived from LLMs, and ExtremeWeatherNews, a large dataset of extreme weather event-related news articles. EWRA and ExtremeWeatherNews together form the overall framework, ClimaEmpact, that focuses on addressing three critical extreme-weather tasks: categorization of tangible vulnerabilities/impacts, topic labeling, and emotion analysis. By aligning SLMs with advanced reasoning strategies on ExtremeWeatherNews (and its derived dataset ExtremeAlign used specifically for SLM alignment), EWRA improves the SLMs' ability to generate well-grounded and domain-specific responses for extreme weather analytics. Our results show that the approach proposed guides SLMs to output domain-aligned responses, surpassing the performance of task-specific models and offering enhanced real-world applicability for extreme weather analytics.
- Abstract(参考訳): 極度の気象事象の正確な評価は研究や政策に欠かせないが、地域化や粒度のデータは世界の多くの地域では残っていない。
このデータギャップは、極端な気象現象の潜在的な結果と影響を分析する能力を制限し、効果的な意思決定を妨げる。
大規模言語モデル(LLM)は、膨大な量の構造化されていないテキストデータを処理し、意味のある洞察を抽出し、複数のソースから情報を合成することで詳細な評価を生成する。
さらに、LLMは言語理解をより小さなモデルにシームレスに移行し、特定のタスクを微調整しながら重要な知識を保持することができる。
本稿では,LLMから導出される構造的推論経路を組み込んだ小型言語モデル(SLM)を強化する手法であるExtreme Weather Reasoning-Aware Alignment(EWRA)と,極度気象事象関連ニュース記事の大規模データセットであるExtremeWeatherNewsを提案する。
EWRAとExtremeWeatherNewsは、全体的なフレームワークであるClimaEmpactを形成している。これは、3つの重要な極悪課題に対処することに焦点を当てている。
SLMをExtremeWeatherNews(およびその派生したデータセットExtremeAlignをSLMアライメントに用いた)の高度な推論戦略と整合させることで、EWRAは極度の気象分析のために、十分に地平とドメイン固有の応答を生成する能力を向上させる。
提案手法は,タスク固有モデルの性能を超越し,極端気象解析のための実世界適用性の向上を図り,ドメイン対応応答を出力するSLMを誘導することを示す。
関連論文リスト
- From Reviews to Dialogues: Active Synthesis for Zero-Shot LLM-based Conversational Recommender System [49.57258257916805]
大きな言語モデル(LLM)は強力なゼロショットレコメンデーション機能を示している。
現実的なアプリケーションは、スケーラビリティ、解釈可能性、データプライバシの制約により、より小さく、内部的に管理された推奨モデルを好むことが多い。
能動学習技術によって導かれるブラックボックスLSMを利用して,会話学習データを合成する能動データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-21T23:05:47Z) - On the Temporal Question-Answering Capabilities of Large Language Models Over Anonymized Data [1.2979906794584584]
訓練中に存在しないデータに対する時間的推論タスクにおけるLarge Language Model(LLM)の適用性はまだ検討されていない分野である。
本稿では、構造化および半構造化された匿名化データに焦点をあてて、このトピックについて論じる。
自然言語における17の共通時間的推論タスクを特定し,そのアルゴリズム的構成要素に着目した。
論文 参考訳(メタデータ) (2025-04-10T10:48:42Z) - EF-LLM: Energy Forecasting LLM with AI-assisted Automation, Enhanced Sparse Prediction, Hallucination Detection [8.540308127679985]
本稿では,時系列予測のためのドメイン知識と時間データを統合するEnergy Forecasting Large Language Model (EF-LLM)を提案する。
EF-LLMの人間とAIのインタラクション能力は、タスクの予測におけるエントリー障壁を低くし、さらなる専門家の関与の必要性を減らす。
我々は、負荷、太陽光発電、風力発電予測のエネルギー予測シナリオで成功している。
論文 参考訳(メタデータ) (2024-10-30T11:22:37Z) - Language Agents Meet Causality -- Bridging LLMs and Causal World Models [50.79984529172807]
因果表現学習を大規模言語モデルと統合する枠組みを提案する。
このフレームワークは、自然言語表現に関連付けられた因果変数を持つ因果世界モデルを学ぶ。
本研究では,時間的スケールと環境の複雑さを考慮した因果推論と計画課題の枠組みを評価する。
論文 参考訳(メタデータ) (2024-10-25T18:36:37Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting [28.560095276214543]
気象・気候イベント予測(WCEF)を提案し,気象・気候事象を予測する。
CLLMateは、26,156の環境ニュース記事とERA5の再分析データを用いたWCEFの最初のデータセットである。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
論文 参考訳(メタデータ) (2024-09-27T18:00:13Z) - Exploring Language Model Generalization in Low-Resource Extractive QA [57.14068405860034]
ドメインドリフト下でのLarge Language Models (LLM) を用いた抽出質問応答(EQA)について検討する。
性能ギャップを実証的に説明するための一連の実験を考案する。
論文 参考訳(メタデータ) (2024-09-27T05:06:43Z) - Enhancing Temporal Understanding in LLMs for Semi-structured Tables [50.59009084277447]
我々は、大規模言語モデル(LLM)の特定の限界を特定するために、時間的データセットの包括的な分析を行う。
調査の結果,時間的時間的質問応答に特化したデータセットであるTempTabQAが強化された。
我々は,この領域におけるLLM機能を強化するために,新しいアプローチC.L.E.A.R.を導入する。
論文 参考訳(メタデータ) (2024-07-22T20:13:10Z) - A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0261082985087]
時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。
LLMの入力に生テキストを直接統合しても、ゼロショット補間性能は向上しないことがわかった。
対照的に、特定の複雑なイベントや微調整LDMに生テキストを組み込むことで、性能が大幅に向上する。
論文 参考訳(メタデータ) (2024-07-16T11:58:54Z) - Personalized Adapter for Large Meteorology Model on Devices: Towards Weather Foundation Models [36.229082478423585]
LM-Weatherは、事前訓練された言語モデル(PLM)を使用する一般的なアプローチである
PLMに軽量なパーソナライズドアダプタを導入し、気象パターンの認識に役立てる。
実験の結果、LM-Weatherは様々なタスクにおいて最先端の結果より優れていた。
論文 参考訳(メタデータ) (2024-05-24T15:25:09Z) - DeepClimGAN: A High-Resolution Climate Data Generator [60.59639064716545]
地球系モデル(ESM)は、気候変動シナリオの将来の予測を生成するためにしばしば用いられる。
妥協として、エミュレータはかなり安価であるが、ESMの複雑さを全て備えているわけではない。
本稿では, ESMエミュレータとして, 条件付き生成逆数ネットワーク(GAN)の使用を実証する。
論文 参考訳(メタデータ) (2020-11-23T20:13:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。