論文の概要: Bidirectional Semantic Complementary Tool Retrieval for Remote Sensing Agents
- arxiv url: http://arxiv.org/abs/2606.07538v1
- Date: Wed, 29 Apr 2026 14:07:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.688973
- Title: Bidirectional Semantic Complementary Tool Retrieval for Remote Sensing Agents
- Title(参考訳): リモートセンシングエージェントのための双方向セマンティック補完ツール検索
- Authors: Zeyuan Wang, Dongyang Hou, Cheng Yang, Xuezhi Cui, Linrui Xu, Bo Yu, Gaozhi Zhou, Ziyu Li, Liangtian Liu, Kai Ouyang, Wang Guo, Lili Zhu, Chao Tao,
- Abstract要約: 大規模言語モデル(LLM)に基づくエージェントは、リモートセンシング(RS)データの自動処理のための新しいパラダイムを提供する。
意味的非対称性」に直面する既存のツール検索手法
本稿では,双方向のセマンティック補完ツール検索手法を提案する。
- 参考スコア(独自算出の注目度): 14.603837941754483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM)-based agents provide a novel paradigm for the automated processing of remote sensing(RS) data. Their success in complex RS tasks rely on extensive specialized tool libraries. However, tool documentation often exceeds the context window limits of LLMs, making precise tool retrieval essential for agentic workflows. Existing tool retrieval methods face "semantic asymmetry" bottleneck: natural language queries typically express macro-level intentions lacking tool-specific semantics, while tool documentation provides fine-grained technical descriptions lacking operational context for workflows. To bridge this semantic gap, this paper proposes a bidirectional semantic complementary tool retrieval method. First, on the query side, we introduce a planning-based query enhancement mechanism that leverages the reasoning capabilities of agents to decompose abstract intentions into logical subtasks, thereby actively supplementing the query with missing functional semantics. Second, on the tool side, addressing the strong coupling characteristics of RS tool chains, we construct a dynamic tool dependency graph with continual learning capabilities. By employing a neighborhood information aggregation mechanism, contextual information from precursor tools is explicitly injected into the current node representation, enriching tool descriptions with contextual semantics. Experimental results on the RS dataset GeoPlan-bench and the general-purpose dataset API- Bank demonstrate that the proposed method not only significantly improves tool retrieval accuracy for complex RS tasks but also exhibits robust extensibility for transfer to general-domain tasks. The source code and dataset are available at https://github.com/geox-lab/BSCTR.
- Abstract(参考訳): 大規模言語モデル(LLM)に基づくエージェントは、リモートセンシング(RS)データの自動処理のための新しいパラダイムを提供する。
複雑なRSタスクにおける彼らの成功は、広範な特殊なツールライブラリに依存している。
しかし、ツールドキュメンテーションはLLMのコンテキストウインドウ限界を超えることが多く、エージェントワークフローにとって正確なツール検索が不可欠である。
既存のツール検索手法は"セマンティックな非対称性"のボトルネックに直面している: 自然言語クエリは通常、ツール固有のセマンティクスを欠いたマクロレベルの意図を表現する。
本稿では,このセマンティックギャップを埋めるために,双方向のセマンティック補完ツール検索手法を提案する。
まず、クエリ側では、エージェントの推論能力を活用して、抽象的な意図を論理的なサブタスクに分解し、機能的セマンティクスを欠くクエリを積極的に補完するクエリ拡張機構を導入する。
第2に、ツール側では、RSツールチェーンの強い結合特性に対処するため、継続的な学習機能を備えた動的ツール依存グラフを構築します。
近隣情報集約機構を利用することで、前駆者ツールからのコンテキスト情報を現在のノード表現に明示的に注入し、コンテキスト意味論によるツール記述を充実させる。
RSデータセットGeoPlan-benchと汎用データセットAPI- Bankの実験結果は、提案手法が複雑なRSタスクのツール検索精度を大幅に向上するだけでなく、汎用ドメインタスクへの転送の堅牢な拡張性も示している。
ソースコードとデータセットはhttps://github.com/geox-lab/BSCTRで公開されている。
関連論文リスト
- RS-Claw: Progressive Active Tool Exploration via Hierarchical Skill Trees for Remote Sensing Agents [14.606770347521008]
本稿では、エージェントがツール空間内でアクティブなエクスプローラーとして振る舞うべきであると論じる。
ツールエンドでのスキルカプセル化技術を活用することにより,RS-Clawを提案する。
このアーキテクチャは、ツール記述を階層的に構成し、エージェントがオンデマンドでシーケンシャルな意思決定を実行できるようにする。
論文 参考訳(メタデータ) (2026-05-13T11:49:18Z) - RaTA-Tool: Retrieval-based Tool Selection with Multimodal Large Language Models [57.15854852525046]
オープンワールドマルチモーダルツール選択のための新しいフレームワークであるRaTA-Toolを紹介する。
提案手法により,MLLMはマルチモーダルクエリを構造化されたタスク記述に変換し,次に最も適切なツールを検索することができる。
タスク記述とツール選択の整合性をさらに向上するため、好みに基づく最適化段階を取り入れた。
論文 参考訳(メタデータ) (2026-04-16T12:47:09Z) - ToolFlood: Beyond Selection -- Hiding Valid Tools from LLM Agents via Semantic Covering [2.6928305857508974]
本稿では,ツール拡張型Large Language Model (LLM)エージェントに対する検索層攻撃であるToolFloodを紹介する。
検索後にどのツールが選択されるかを変更するのではなく、ToolFloodは、いくつかのアタッカー制御ツールを注入することで、検索自体を圧倒する。
ToolFloodは、95%のアタック成功率と低インジェクション率を実現している。
論文 参考訳(メタデータ) (2026-03-14T13:54:49Z) - ToolLibGen: Scalable Automatic Tool Creation and Aggregation for LLM Reasoning [80.10274552177096]
外部ツールを備えたLarge Language Models (LLM) は、複雑な推論タスクにおけるパフォーマンスの向上を実証している。
このツールに強化された推論が広く採用されるのは、ドメイン固有のツールが不足しているためである。
構造化ツールライブラリに非構造化ツールのコレクションを自動的に組み込むための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-09T04:11:16Z) - MassTool: A Multi-Task Search-Based Tool Retrieval Framework for Large Language Models [45.63804847907601]
MassToolは、クエリ表現とツール検索の精度を向上させるために設計されたマルチタスク検索ベースのフレームワークである。
関数呼び出しの必要性を予測するツール使用検知塔と、クエリ中心のグラフ畳み込みネットワーク(QC-GCN)を活用して効率的なクエリツールマッチングを行うツール検索塔である。
MassToolは、ツール使用の検出損失、リストワイズ検索損失、コントラスト正規化損失を共同で最適化することにより、厳密なクエリ理解のための堅牢な2段階のシーケンシャル意思決定パイプラインを確立する。
論文 参考訳(メタデータ) (2025-07-01T07:02:26Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - Improving Tool Retrieval by Leveraging Large Language Models for Query Generation [16.7926347207647]
コンテキスト内学習は、プロンプトで関連するツールの短いリストを提供することができる。
本稿では,Large Language Models (LLM) を用いて検索クエリを生成することを提案する。
生成されたクエリは埋め込みされ、最も近い隣の検索を通じて最も関連性の高いツールを見つけるために使用される。
論文 参考訳(メタデータ) (2024-11-17T03:02:09Z) - Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval [47.81307125613145]
Re-Invokeは、トレーニングなしで大規模ツールセットに効果的にスケールするために設計された教師なしツール検索手法である。
我々は、クエリ毎に最も関連性の高いツールを特定するために、意図に基づいて、新しいマルチビュー類似度ランキング戦略を採用する。
評価の結果、Re-Invokeはシングルツールとマルチツールの両方のシナリオにおいて、最先端の代替よりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-03T22:49:27Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。