論文の概要: Exploring Robust Multi-Agent Workflows for Environmental Data Management
- arxiv url: http://arxiv.org/abs/2604.01647v1
- Date: Thu, 02 Apr 2026 05:46:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.459685
- Title: Exploring Robust Multi-Agent Workflows for Environmental Data Management
- Title(参考訳): 環境データ管理のためのロバストなマルチエージェントワークフローの探索
- Authors: Boyuan Guan, Jason Liu, Yanzhao Wu, Kiavash Bahreini,
- Abstract要約: EnviSmartは、環境研究のためのキャンパス全体のストレージインフラ上にデプロイされた生産データ管理システムである。
振舞い(ガバナンス制約)、ドメイン知識(検索可能なコンテキスト)、スキル(ツールを使用する手順)を永続的でインターロック可能なアーティファクトとして外部化する。
- 参考スコア(独自算出の注目度): 2.556033550563853
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embedding LLM-driven agents into environmental FAIR data management is compelling - they can externalize operational knowledge and scale curation across heterogeneous data and evolving conventions. However, replacing deterministic components with probabilistic workflows changes the failure mode: LLM pipelines may generate plausible but incorrect outputs that pass superficial checks and propagate into irreversible actions such as DOI minting and public release. We introduce EnviSmart, a production data management system deployed on campus-wide storage infrastructure for environmental research. EnviSmart treats reliability as an architectural property through two mechanisms: a three-track knowledge architecture that externalizes behaviors (governance constraints), domain knowledge (retrievable context), and skills (tool-using procedures) as persistent, interlocking artifacts; and a role-separated multi-agent design where deterministic validators and audited handoffs restore fail-stop semantics at trust boundaries before irreversible steps. We compare two production deployments. The University's GIS Center Ecological Archive (849 curated datasets) serves as a single-agent baseline. SF2Bench, a compound flooding benchmark comprising 2,452 monitoring stations and 8,557 published files spanning 39 years, validates the multi-agent workflow. The multi-agent approach improved both efficiency - completed by a single operator in two days with repeated artifact reuse across deployments - and reliability: audited handoffs detected and blocked a coordinate transformation error affecting all 2,452 stations before publication. A representative incident (ISS-004) demonstrated boundary-based containment with 10-minute detection latency, zero user exposure, and 80-minute resolution. This paper has been accepted at PEARC 2026.
- Abstract(参考訳): LLM駆動のエージェントを環境FAIRデータ管理に組み込むことは魅力的なことです。
しかし、決定論的コンポーネントを確率的ワークフローに置き換えると、障害モードが変わる: LLMパイプラインは、表面的なチェックをパスし、DOIマイニングや公開リリースのような不可逆的なアクションに伝播する、可塑性だが不正な出力を生成する可能性がある。
本研究では,環境研究のためのキャンパス規模のストレージインフラ上に展開する生産データ管理システムEnviSmartを紹介する。
EnviSmartは2つのメカニズムを通じて、信頼性をアーキテクチャ上の特性として扱う。3トラックの知識アーキテクチャは、動作(ガバナンス制約)、ドメイン知識(検索可能なコンテキスト)、スキル(ツールを使用する手順)を永続的でインターロック可能なアーティファクトとして外部化する。
2つのプロダクションデプロイメントを比較します。
大学のGISセンター生態アーカイブ(849のキュレートされたデータセット)は、単一エージェントのベースラインとして機能している。
SF2Benchは、39年にわたる2,452の監視ステーションと8,557の公開ファイルからなる複合フラッディングベンチマークであり、マルチエージェントワークフローを検証する。
マルチエージェントのアプローチでは,2日間でひとつのオペレータによって完了し,デプロイの繰り返しアーティファクトの再利用 – と信頼性 – が向上した。
代表的インシデント(ISS-004)は、10分間の検知遅延、ユーザ露出のゼロ、80分間の解像度で境界ベースの封じ込めを実証した。
この論文はPEARC 2026で受け入れられた。
関連論文リスト
- Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers [27.817039954088315]
ツールレベルの専門知識を学習するための自己進化型マルチエージェントシステムである textbfGeoEvolver を紹介する。
GeoEvolverはエンドツーエンドのタスクの成功を継続的に改善し、複数のバックボーンで平均12%向上することを示す。
論文 参考訳(メタデータ) (2026-01-30T15:11:07Z) - Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Automatic Building Code Review: A Case Study [6.530899637501737]
建設担当者は、プロジェクトのサイズと複雑さが増大するにつれて、労働集約的で、エラーを起こし、コストがかかる設計文書のレビューに直面します。
本研究では,BIMに基づくデータ抽出と自動検証を統合したエージェント駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-03T00:30:14Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。