論文の概要: Zephyrus: An Agentic Framework for Weather Science
- arxiv url: http://arxiv.org/abs/2510.04017v1
- Date: Sun, 05 Oct 2025 03:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.399384
- Title: Zephyrus: An Agentic Framework for Weather Science
- Title(参考訳): Zephyrus: 気象学のためのエージェントフレームワーク
- Authors: Sumanth Varambally, Marshall Fisher, Jas Thakker, Yiwei Chen, Zhirui Xia, Yasaman Jafari, Ruijia Niu, Manas Jain, Veeramakali Vignesh Manivannan, Zachary Novack, Luyu Han, Srikar Eranky, Salva Rühling Cachay, Taylor Berg-Kirkpatrick, Duncan Watson-Parris, Yi-An Ma, Rose Yu,
- Abstract要約: 気象学の基礎モデルは、大量の構造化された数値データと従来の天気予報システムより優れた性能で事前訓練されている。
大規模言語モデル(LLM)は、テキストの理解と生成に優れるが、高次元の気象データセットを推論することはできない。
気象学の新しいエージェント・フレームワークを構築することで、このギャップを埋める。
我々は、気象データセットを反復的に分析し、結果を観察し、会話フィードバックループを通じてアプローチを洗練するマルチターンLCMベースの気象エージェントであるZephyrusを設計する。
- 参考スコア(独自算出の注目度): 47.611521052984365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models for weather science are pre-trained on vast amounts of structured numerical data and outperform traditional weather forecasting systems. However, these models lack language-based reasoning capabilities, limiting their utility in interactive scientific workflows. Large language models (LLMs) excel at understanding and generating text but cannot reason about high-dimensional meteorological datasets. We bridge this gap by building a novel agentic framework for weather science. Our framework includes a Python code-based environment for agents (ZephyrusWorld) to interact with weather data, featuring tools like an interface to WeatherBench 2 dataset, geoquerying for geographical masks from natural language, weather forecasting, and climate simulation capabilities. We design Zephyrus, a multi-turn LLM-based weather agent that iteratively analyzes weather datasets, observes results, and refines its approach through conversational feedback loops. We accompany the agent with a new benchmark, ZephyrusBench, with a scalable data generation pipeline that constructs diverse question-answer pairs across weather-related tasks, from basic lookups to advanced forecasting, extreme event detection, and counterfactual reasoning. Experiments on this benchmark demonstrate the strong performance of Zephyrus agents over text-only baselines, outperforming them by up to 35 percentage points in correctness. However, on harder tasks, Zephyrus performs similarly to text-only baselines, highlighting the challenging nature of our benchmark and suggesting promising directions for future work.
- Abstract(参考訳): 気象学の基礎モデルは、大量の構造化された数値データと従来の天気予報システムより優れた性能で事前訓練されている。
しかし、これらのモデルは言語に基づく推論能力に欠けており、対話的な科学的なワークフローにおけるその有用性を制限している。
大規模言語モデル(LLM)は、テキストの理解と生成に優れるが、高次元の気象データセットを推論することはできない。
気象学の新しいエージェント・フレームワークを構築することで、このギャップを埋める。
私たちのフレームワークには、天気データと対話するためのエージェント(ZephyrusWorld)のためのPythonコードベースの環境が含まれており、WeatherBench 2データセットのインターフェース、自然言語からの地理マスクのジオクエリ、天気予報、気候シミュレーション機能などのツールが特徴です。
我々は、気象データセットを反復的に分析し、結果を観察し、会話フィードバックループを通じてアプローチを洗練するマルチターンLCMベースの気象エージェントであるZephyrusを設計する。
我々はエージェントに新しいベンチマークであるZephyrusBenchを伴って、基本的なルックアップから高度な予測、極端なイベント検出、および反事実推論に至るまで、気象関連のタスクにまたがる多様な質問応答ペアを構築するスケーラブルなデータ生成パイプラインを構築した。
このベンチマークの実験は、テキストのみのベースラインよりもZephyrusエージェントの強い性能を示し、最大35パーセントの正確さでそれらを上回ります。
しかし、難しいタスクでは、Zephyrusはテキストのみのベースラインと同じように動作し、ベンチマークの難易度を強調し、今後の作業に向けた有望な方向性を示唆している。
関連論文リスト
- WeatherGFM: Learning A Weather Generalist Foundation Model via In-context Learning [69.82211470647349]
第1次一般気象基礎モデル(WeatherGFM)を紹介する。
気象理解タスクの幅広い範囲を統一的な方法で解決する。
我々のモデルは、天気予報、超解像、天気画像翻訳、後処理など、最大10の気象理解タスクを効果的に処理できる。
論文 参考訳(メタデータ) (2024-11-08T09:14:19Z) - WeatherQA: Can Multimodal Language Models Reason about Severe Weather? [45.43764278625153]
干し草、竜巻、雷雨などの激しい対流的な気象イベントは、しばしば急速に起こるが、大きな被害を招き、毎年何十億ドルもの費用がかかる。
このことは、気象学者や住民のリスクの高い地域での適切な準備のために、前もって厳しい天候の脅威を予知することの重要性を強調している。
我々は、気象パラメータの複雑な組み合わせを推論し、現実のシナリオで厳しい天候を予測するために、機械用に設計された最初のマルチモーダルデータセットであるWeatherQAを紹介する。
論文 参考訳(メタデータ) (2024-06-17T05:23:18Z) - Towards an end-to-end artificial intelligence driven global weather forecasting system [57.5191940978886]
我々は,地球規模の気象変動に対するAIに基づくデータ同化モデル,すなわちAdasを提案する。
我々は,アダスが地球観測を同化して高品質な分析を行い,長期にわたって安定して運用できることを実証した。
この手法を現実のシナリオに適用するのは,私たちが初めてです。
論文 参考訳(メタデータ) (2023-12-18T09:05:28Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z) - WeatherBench: A benchmark dataset for data-driven weather forecasting [17.76377510880905]
データ駆動型中距離天気予報のためのベンチマークデータセットを提案する。
機械学習モデルでの使用を容易にするために処理されたERA5アーカイブから得られたデータを提供する。
単純な線形回帰手法、ディープラーニングモデル、および純粋に物理的な予測モデルからベースラインスコアを提供する。
論文 参考訳(メタデータ) (2020-02-02T19:20:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。