論文の概要: OpenEarth-Agent: From Tool Calling to Tool Creation for Open-Environment Earth Observation
- arxiv url: http://arxiv.org/abs/2603.22148v1
- Date: Mon, 23 Mar 2026 16:14:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.774551
- Title: OpenEarth-Agent: From Tool Calling to Tool Creation for Open-Environment Earth Observation
- Title(参考訳): OpenEarth-Agent: オープン環境地球観測のためのツールコールからツール作成まで
- Authors: Sijie Zhao, Feng Liu, Xueliang Zhang, Hao Chen, Xinyu Gu, Zhe Jiang, Fenghua Ling, Ben Fei, Wenlong Zhang, Junjue Wang, Weihao Xuan, Pengfeng Xiao, Naoto Yokoya, Lei Bai,
- Abstract要約: オープン環境の地球観測に適した最初のツール作成エージェントフレームワークであるOpenEarth-Agentを紹介する。
OpenEarth-Agentは事前に定義されたツールを呼び出すのではなく、適応的なワークフロー計画とツール作成を使用して、目に見えないデータやタスクに一般化する。
OpenEarth-Agentは、オープン環境で複数のドメインにまたがって完全なEOをマスターできることを示す。
- 参考スコア(独自算出の注目度): 52.19243746173158
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Earth Observation (EO) is essential for perceiving dynamic land surface changes, yet deploying autonomous EO in open environments is hindered by the immense diversity of multi-source data and heterogeneous tasks. While remote sensing agents have emerged to streamline EO workflows, existing tool-calling agents are confined to closed environments. They rely on pre-defined tools and are restricted to narrow scope, limiting their generalization to the diverse data and tasks. To overcome these limitations, we introduce OpenEarth-Agent, the first tool-creation agent framework tailored for open-environment EO. Rather than calling predefined tools, OpenEarth-Agent employs adaptive workflow planning and tool creation to generalize to unseen data and tasks. This adaptability is bolstered by an open-ended integration of multi-stage tools and cross-domain knowledge bases, enabling robust execution in the entire EO pipeline across multiple application domains. To comprehensively evaluate EO agents in open environments, we propose OpenEarth-Bench, a novel benchmark comprising 596 real-world, full-pipeline cases across seven application domains, explicitly designed to assess agents' adaptive planning and tool creation capabilities. Only essential pre-trained model tools are provided in this benchmark, devoid of any other predefined task-specific tools. Extensive experiments demonstrate that OpenEarth-Agent successfully masters full-pipeline EO across multiple domains in the open environment. Notably, on the cross-benchmark Earth-Bench, our tool-creating agent equipped with 6 essential pre-trained models achieves performance comparable to tool-calling agents relying on 104 specialized tools, and significantly outperforms them when provided with the complete toolset. In several cases, the created tools exhibit superior robustness to data anomalies compared to human-engineered counterparts.
- Abstract(参考訳): 地球観測(EO)は、地表の動的変化を知覚するために不可欠であるが、オープン環境での自律的なEOの展開は、マルチソースデータと異種タスクの膨大な多様性によって妨げられている。
リモートセンシングエージェントがEOワークフローを合理化する一方で、既存のツールコールエージェントはクローズド環境に限定されている。
定義済みのツールに依存しており、範囲が狭いため、一般化はさまざまなデータやタスクに限られている。
これらの制限を克服するために、オープン環境EOに適した最初のツール作成エージェントフレームワークであるOpenEarth-Agentを紹介します。
OpenEarth-Agentは事前に定義されたツールを呼び出すのではなく、適応的なワークフロー計画とツール作成を使用して、目に見えないデータやタスクに一般化する。
この適応性は、マルチステージツールとクロスドメインの知識ベースとのオープンな統合によって強化され、複数のアプリケーションドメインにわたるEOパイプライン全体の堅牢な実行を可能にします。
オープン環境におけるEOエージェントを包括的に評価するために,OpenEarth-Benchを提案する。
このベンチマークでは、事前訓練されたモデルツールのみが提供され、他の事前定義されたタスク固有のツールが欠如している。
大規模な実験により、OpenEarth-Agentはオープン環境で複数のドメインにまたがって完全なEOをマスターすることに成功した。
特に,Earth-Benchのクロスベンチマークでは,ツール作成エージェントは,104の専門ツールに依存したツールコールエージェントに匹敵する性能を達成し,完全なツールセットが提供されると大幅に性能が向上する。
いくつかのケースでは、生成されたツールは、人間工学的なツールに比べて、データ異常に対して優れた堅牢性を示す。
関連論文リスト
- Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning [62.499592503950026]
大規模言語モデル(LLM)は、ツールや環境とのマルチターンインタラクションを必要とする複雑なタスクを実行するために、自律エージェントに権限を与えている。
完全合成環境生成パイプラインであるエージェント・ワールド・モデル(AWM)を提案する。
私たちは、エージェントがリッチなツールセットと対話できる、毎日のシナリオをカバーする1,000の環境にスケールします。
論文 参考訳(メタデータ) (2026-02-10T18:55:41Z) - Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers [27.817039954088315]
ツールレベルの専門知識を学習するための自己進化型マルチエージェントシステムである textbfGeoEvolver を紹介する。
GeoEvolverはエンドツーエンドのタスクの成功を継続的に改善し、複数のバックボーンで平均12%向上することを示す。
論文 参考訳(メタデータ) (2026-01-30T15:11:07Z) - ToolGym: an Open-world Tool-using Environment for Scalable Agent Testing and Data Curation [42.479399507055454]
一般的な204のアプリにまたがって,571フォーマットの統一ツール上に構築された,オープンワールドのツール使用環境を紹介します。
これには、ロングホライゾンを合成するタスク生成エンジン、ワイルド制約付きマルチツール、ストレス-テストの堅牢性に割り込みと失敗を注入するステートコントローラが含まれる。
最先端のLLMの総合評価では、ツール計画と実行能力の相違、既存のLLMの弱点に続く制約、DeepSeek-v3.2の強靭さが明らかにされている。
論文 参考訳(メタデータ) (2026-01-09T21:59:31Z) - CuES: A Curiosity-driven and Environment-grounded Synthesis Framework for Agentic RL [35.086788669916594]
大規模言語モデルベースのエージェントは、複雑なツール拡張環境にますますデプロイされている。
既存のアプローチは通常、新しい環境で失敗する前提である事前定義されたタスクコレクションを仮定する。
そこで我々はCuESを提案する。CuESはキュリオシティ駆動環境基盤合成フレームワークで、多様で実行可能で有意義なタスクを自律的に生成する。
論文 参考訳(メタデータ) (2025-12-01T06:11:37Z) - DeepAgent: A General Reasoning Agent with Scalable Toolsets [111.6384541877723]
DeepAgentは、自律的な思考、ツール発見、アクション実行を実行するエンドツーエンドのディープ推論エージェントである。
長期にわたる相互作用の課題に対処するために,過去の相互作用を構造化エピソード,動作,ツール記憶に圧縮する自律的メモリ折り畳み機構を導入する。
LLMシミュレートされたAPIを活用し、ツール呼び出しトークンにきめ細かいクレジットを割り当てるツールコールアドバンテージ属性を適用した、エンドツーエンドの強化学習戦略であるToolPOを開発した。
論文 参考訳(メタデータ) (2025-10-24T16:24:01Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。