論文の概要: HVR-Met: A Hypothesis-Verification-Replaning Agentic System for Extreme Weather Diagnosis
- arxiv url: http://arxiv.org/abs/2603.01121v1
- Date: Sun, 01 Mar 2026 14:13:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.521487
- Title: HVR-Met: A Hypothesis-Verification-Replaning Agentic System for Extreme Weather Diagnosis
- Title(参考訳): HVR-Met:極端気象診断のための仮説検証記述エージェントシステム
- Authors: Shuo Tang, Jiadong Zhang, Jian Xu, Gengxian Zhou, Qizhao Jin, Qinxuan Wang, Yi Hu, Ning Hu, Hongchang Ren, Lingli He, Jiaolan Fu, Jingtao Ding, Shiming Xiang, Chenglin Liu,
- Abstract要約: HVR-Metは、専門家の知識の深い統合を特徴とする気象診断システムである。
その中心となる革新は仮説-検証-計画'の閉ループ機構である。
原子レベルのサブタスクに焦点を当てた新しいベンチマークを導入する。
- 参考スコア(独自算出の注目度): 45.18017161777437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While deep learning-based weather forecasting paradigms have made significant strides, addressing extreme weather diagnostics remains a formidable challenge. This gap exists primarily because the diagnostic process demands sophisticated multi-step logical reasoning, dynamic tool invocation, and expert-level prior judgment. Although agents possess inherent advantages in task decomposition and autonomous execution, current architectures are still hampered by critical bottlenecks: inadequate expert knowledge integration, a lack of professional-grade iterative reasoning loops, and the absence of fine-grained validation and evaluation systems for complex workflows under extreme conditions. To this end, we propose HVR-Met, a multi-agent meteorological diagnostic system characterized by the deep integration of expert knowledge. Its central innovation is the ``Hypothesis-Verification-Replanning'' closed-loop mechanism, which facilitates sophisticated iterative reasoning for anomalous meteorological signals during extreme weather events. To bridge gaps within existing evaluation frameworks, we further introduce a novel benchmark focused on atomic-level subtasks. Experimental evidence demonstrates that the system excels in complex diagnostic scenarios.
- Abstract(参考訳): 深層学習に基づく天気予報のパラダイムは大きな進歩を遂げているが、極端な気象診断に対処することは依然として困難な課題である。
このギャップは、診断プロセスが洗練された多段階論理的推論、動的ツールの実行、専門家レベルの事前判断を必要とするため、主に存在する。
エージェントはタスクの分解と自律実行に固有のアドバンテージを持っているが、現在のアーキテクチャは依然として重要なボトルネックによって妨げられている。
この目的のために,専門知識の深い統合を特徴とするマルチエージェント気象診断システムであるHVR-Metを提案する。
その中心となる革新は 'Hypothesis-Verification-Replanning' の閉ループ機構であり、極度の気象イベントにおける異常気象信号の洗練された反復推論を容易にする。
既存の評価フレームワークのギャップを埋めるために、原子レベルのサブタスクに焦点を当てた新しいベンチマークを導入する。
実験的な証拠は、システムが複雑な診断シナリオで優れていることを証明している。
関連論文リスト
- AnomaMind: Agentic Time Series Anomaly Detection with Tool-Augmented Reasoning [24.317775311623922]
AnomaMindは、連続的な意思決定プロセスとして異常検出を再構成する時系列異常検出フレームワークである。
AnomaMindは、粗い方法で異常間隔をローカライズする構造化ワークフローを運用する。
AnomaMindの重要な設計は、ツール拡張された異常検出のための、明示的に設計されたハイブリッド推論メカニズムである。
論文 参考訳(メタデータ) (2026-02-14T14:35:34Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - AstroReason-Bench: Evaluating Unified Agentic Planning across Heterogeneous Space Planning Problems [71.89040853616602]
宇宙計画問題(SPP)におけるエージェント計画評価ベンチマークAstroReason-Benchを紹介する。
AstroReason-Benchは地上局通信やアジャイル地球観測を含む複数のスケジューリングシステムを統合し、統合されたエージェント指向のインタラクションプロトコルを提供する。
現在のエージェントは、現実的な制約下でのジェネラリスト計画の鍵となる制約を強調して、かなり性能が劣っていることが判明した。
論文 参考訳(メタデータ) (2026-01-16T15:02:41Z) - EWE: An Agentic Framework for Extreme Weather Analysis [61.092871317626496]
Extreme Weather Expert (EWE)は、このタスクに特化した最初のインテリジェントエージェントフレームワークである。
EWEは、知識誘導計画、クローズドループ推論、およびドメイン調整された気象ツールキットを通じて、専門家の可視化をエミュレートする。
進展を触媒するため、我々は103のハイインパクトイベントをキュレートしたデータセットを含む、この新興分野の最初のベンチマークを紹介した。
論文 参考訳(メタデータ) (2025-11-26T14:37:25Z) - I-GLIDE: Input Groups for Latent Health Indicators in Degradation Estimation [1.034052616244602]
本稿では, 健康指標構築のための新しい枠組みを紹介し, 3つの重要な貢献を推し進める。
我々は、RUL予測の健康指標(HI)としてプロジェクテッドパスウェイ(RaPP)に沿ってレコンストラクションを適応し、従来のリコンストラクションエラー指標よりも優れていることを示す。
また,センササブセットを分離してシステム固有の劣化をモデル化する手法であるインジケータグループを提案し,新しい手法であるI-GLIDEを提案する。
論文 参考訳(メタデータ) (2025-11-26T09:39:35Z) - Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.1999907891494]
We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文 参考訳(メタデータ) (2025-10-01T07:59:03Z) - Enhancing Retrieval Augmentation via Adversarial Collaboration [50.117273835877334]
我々は「検索幻覚」に対処するため、Adrial Collaboration RAG(AC-RAG)フレームワークを提案する。
AC-RAGは、知識ギャップを識別するジェネリスト検出器と、正確な解決策を提供するドメイン特化リゾルバという2つの異種エージェントを使用している。
実験により、AC-RAGは検索精度を大幅に向上し、様々な垂直領域における最先端RAG法より優れていることが示された。
論文 参考訳(メタデータ) (2025-09-18T08:54:20Z) - Process mining-driven modeling and simulation to enhance fault diagnosis in cyber-physical systems [5.065341495341096]
CPS(Cyber-Physical Systems)の故障診断は,システムの信頼性と運用効率の確保に不可欠である。
本稿では, 時系列, プロセスマイニング, シミュレーションにおける集団異常検出を統合した, 教師なし故障診断手法を提案する。
これにより、予測保守と産業環境のためのデジタルツインの開発を支援する総合的なフォールト辞書の作成が可能になる。
論文 参考訳(メタデータ) (2025-06-26T17:29:37Z) - Real-time and Downtime-tolerant Fault Diagnosis for Railway Turnout Machines (RTMs) Empowered with Cloud-Edge Pipeline Parallelism [9.544236630555627]
RTMのリアルタイム・ダウンタイム耐故障診断を可能にするために,エッジクラウド協調早期警戒システムを提案する。
中国江蘇省南京大都市圏が収集した実世界のデータセットでは,アンサンブルに基づく断層診断モデルにより97.4%の精度が得られた。
論文 参考訳(メタデータ) (2024-11-04T13:49:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。