論文の概要: CLIMATEAGENT: Multi-Agent Orchestration for Complex Climate Data Science Workflows
- arxiv url: http://arxiv.org/abs/2511.20109v1
- Date: Tue, 25 Nov 2025 09:27:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.386044
- Title: CLIMATEAGENT: Multi-Agent Orchestration for Complex Climate Data Science Workflows
- Title(参考訳): CLIMATEAGENT: 複雑な気候データサイエンスワークフローのためのマルチエージェントオーケストレーション
- Authors: Hyeonjae Kim, Chenyue Li, Wen Deng, Mengxi Jin, Wen Huang, Mengqian Lu, Binhang Yuan,
- Abstract要約: 我々は、エンドツーエンドの気候データ分析タスクを編成する、自律的なマルチエージェントフレームワークであるClimateAgentを紹介する。
Climate-Agent-Bench-85では、ClimateAgentが100%タスク完了とレポート品質スコア8.32を達成し、GitHub-Copilot(6.27)とGPT-5ベースライン(3.26)を上回りました。
その結果、動的API認識と自己修正実行を備えたマルチエージェントオーケストレーションが、気候科学分析タスクの信頼性とエンドツーエンドの自動化を大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 9.678989760151575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Climate science demands automated workflows to transform comprehensive questions into data-driven statements across massive, heterogeneous datasets. However, generic LLM agents and static scripting pipelines lack climate-specific context and flexibility, thus, perform poorly in practice. We present ClimateAgent, an autonomous multi-agent framework that orchestrates end-to-end climate data analytic workflows. ClimateAgent decomposes user questions into executable sub-tasks coordinated by an Orchestrate-Agent and a Plan-Agent; acquires data via specialized Data-Agents that dynamically introspect APIs to synthesize robust download scripts; and completes analysis and reporting with a Coding-Agent that generates Python code, visualizations, and a final report with a built-in self-correction loop. To enable systematic evaluation, we introduce Climate-Agent-Bench-85, a benchmark of 85 real-world tasks spanning atmospheric rivers, drought, extreme precipitation, heat waves, sea surface temperature, and tropical cyclones. On Climate-Agent-Bench-85, ClimateAgent achieves 100% task completion and a report quality score of 8.32, outperforming GitHub-Copilot (6.27) and a GPT-5 baseline (3.26). These results demonstrate that our multi-agent orchestration with dynamic API awareness and self-correcting execution substantially advances reliable, end-to-end automation for climate science analytic tasks.
- Abstract(参考訳): 気候科学は、包括的な質問を大規模で異質なデータセットにまたがるデータ駆動のステートメントに変換するために、自動化されたワークフローを要求する。
しかし、ジェネリックLLMエージェントと静的スクリプティングパイプラインは気候特有のコンテキストや柔軟性に欠けており、実際は性能が悪くなっている。
エンドツーエンドの気候データ分析ワークフローをオーケストレーションする、自律的なマルチエージェントフレームワークであるClimateAgentを紹介します。
ClimateAgentはユーザ質問をOrchestrate-AgentとPlan-Agentによって調整された実行可能なサブタスクに分解し、ロバストなダウンロードスクリプトを動的にイントロスペクションするData-Agentsを介してデータを取得し、Pythonコードを生成するCoding-Agentで分析とレポートを完了し、視覚化し、組み込みの自己補正ループで最終レポートを作成する。
系統的な評価を可能にするため,大気河川,干ばつ,極端降水,熱波,海面温度,熱帯サイクロンにまたがる85の現実世界タスクのベンチマークであるClimate-Agent-Bench-85を導入する。
Climate-Agent-Bench-85では、ClimateAgentが100%タスク完了とレポート品質スコア8.32を達成し、GitHub-Copilot(6.27)とGPT-5ベースライン(3.26)を上回っている。
これらの結果は、動的API認識と自己修正実行によるマルチエージェントオーケストレーションが、気候科学分析タスクの信頼性とエンドツーエンドの自動化を大幅に向上することを示す。
関連論文リスト
- Autonomous Continual Learning of Computer-Use Agents for Environment Adaptation [57.65688895630163]
ACuRLは自律的なカリキュラム強化学習フレームワークで、エージェントを人間データゼロの特定の環境に継続的に適応させる。
本研究では,環境内学習と環境横断学習の両方を効果的に実現し,既存の環境を忘れずに4~22%の性能向上を実現した。
論文 参考訳(メタデータ) (2026-02-10T23:06:02Z) - AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:21:42Z) - Automating High Energy Physics Data Analysis with LLM-Powered Agents [6.8676809101926075]
本稿では,大規模言語モデル (LLM) エージェントを用いた代表的高エネルギー物理学 (HEP) 解析の自動化を実証する。
ヒッグス粒子二光子断面積測定をATLAS Open Dataのケーススタディとして用いて,LLMベースのスーパーバイザコーダエージェントとSnakemakeワークフローマネージャを組み合わせたハイブリッドシステムを構築した。
このアーキテクチャでは、ワークフローマネージャは決定性を強制し、エージェントはユーザーの指示に応じて分析コードを自動生成し、実行し、反復的に修正する。
論文 参考訳(メタデータ) (2025-12-08T18:13:13Z) - Multi-Agent Systems for Dataset Adaptation in Software Engineering: Capabilities, Limitations, and Future Directions [8.97512410819274]
本稿では,データセット適応タスクにおいて,最先端のマルチエージェントシステムがどのように機能するかについて,最初の実証的研究を行う。
我々は、GitHub Copilotを評価し、ROCODEやLogHub2.0といったベンチマークリポジトリからSE研究成果物を適用する。
その結果、現在のシステムはキーファイルを識別し、部分的な適応を生成することができるが、正しい実装を生成することは滅多にない。
論文 参考訳(メタデータ) (2025-11-26T13:26:11Z) - Zephyrus: An Agentic Framework for Weather Science [47.611521052984365]
気象学の基礎モデルは、大量の構造化された数値データと従来の天気予報システムより優れた性能で事前訓練されている。
大規模言語モデル(LLM)は、テキストの理解と生成に優れるが、高次元の気象データセットを推論することはできない。
気象学の新しいエージェント・フレームワークを構築することで、このギャップを埋める。
我々は、気象データセットを反復的に分析し、結果を観察し、会話フィードバックループを通じてアプローチを洗練するマルチターンLCMベースの気象エージェントであるZephyrusを設計する。
論文 参考訳(メタデータ) (2025-10-05T03:34:08Z) - CoDA: Agentic Systems for Collaborative Data Visualization [57.270599188947294]
深層研究はデータ分析に革命をもたらしたが、データサイエンティストは依然として手作業による視覚化にかなりの時間を費やしている。
単純なシングルエージェントシステムやマルチエージェントシステムを含む既存のアプローチは、しばしばタスクを単純化する。
本稿では,メタデータ分析,タスク計画,コード生成,自己回帰に特殊なLLMエージェントを利用するマルチエージェントシステムであるCoDAを紹介する。
論文 参考訳(メタデータ) (2025-10-03T17:30:16Z) - ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.76389719956301]
我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。
また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文 参考訳(メタデータ) (2025-04-10T02:22:23Z) - DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation [10.390461679868197]
我々は、適応的で堅牢なデータサイエンス自動化のためのノートブック中心の大規模言語モデル(LLM)エージェントフレームワークであるDatawiseAgentを紹介する。
人間のデータサイエンティストが計算ノートブックでどのように機能するかに触発されたDatawiseAgentは、統一された相互作用表現とマルチステージアーキテクチャを導入した。
論文 参考訳(メタデータ) (2025-03-10T08:32:33Z) - AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions [45.0447118979891]
AutoKaggleは、コード実行と単体テストを組み合わせた反復的な開発プロセスを実装し、コードの正しさとロジックの整合性を保証する。
データクリーニング、特徴工学、モデリングのための検証済み機能を含む汎用データサイエンスツールキットは、このソリューションの基礎を形成します。
AutoKaggleは、一般的なデータサイエンスパイプラインにおけるバリデーションレート0.85と総合スコア0.82を達成する。
論文 参考訳(メタデータ) (2024-10-27T12:44:25Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - APIGen: Automated Pipeline for Generating Verifiable and Diverse Function-Calling Datasets [99.8988504388011]
APIGenは、関数呼び出しアプリケーションのための検証可能な高品質データセットを合成するために設計された、自動データ生成パイプラインである。
APIGenを活用して、21のカテゴリにわたる3,673の実行可能なAPIを収集し、多様な関数呼び出しデータセットを生成します。
機能呼び出しエージェントドメインの分野を推し進めるため、6万の高品質なエントリを含むデータセットをリリースする。
論文 参考訳(メタデータ) (2024-06-26T17:49:11Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。