論文の概要: NeSy-Route: A Neuro-Symbolic Benchmark for Constrained Route Planning in Remote Sensing
- arxiv url: http://arxiv.org/abs/2603.16307v1
- Date: Tue, 17 Mar 2026 09:43:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.203473
- Title: NeSy-Route: A Neuro-Symbolic Benchmark for Constrained Route Planning in Remote Sensing
- Title(参考訳): NeSy-Route:リモートセンシングにおける制約経路計画のためのニューロシンボリックベンチマーク
- Authors: Ming Yang, Zhi Zhou, Shi-Yu Tian, Kun-Yang Yu, Lan-Zhe Guo, Yu-Feng Li,
- Abstract要約: NeSy-Routeは、リモートセンシングにおける制約されたルート計画のための大規模なニューロシンボリックベンチマークである。
本ベンチマークでは,高忠実度セマンティックマスクとセマンティックサーチを統合した自動データ生成フレームワークを提案する。
NeSy-Routeは10,821のルート計画サンプルの計画を総合的に評価した。
- 参考スコア(独自算出の注目度): 25.09429306908567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote sensing underpins crucial applications such as disaster relief and ecological field surveys, where systems must understand complex scenes and constraints and make reliable decisions. Current remote-sensing benchmarks mainly focus on evaluating perception and reasoning capabilities of multimodal large language models (MLLMs). They fail to assess planning capability, stemming either from the difficulty of curating and validating planning tasks at scale or from evaluation protocols that are inaccurate and inadequate. To address these limitations, we introduce NeSy-Route, a large-scale neuro-symbolic benchmark for constrained route planning in remote sensing. Within this benchmark, we introduce an automated data-generation framework that integrates high-fidelity semantic masks with heuristic search to produce diverse route-planning tasks with provably optimal solutions. This allows NeSy-Route to comprehensively evaluate planning across 10,821 route-planning samples, nearly 10 times larger than the largest prior benchmark. Furthermore, a three-level hierarchical neuro-symbolic evaluation protocol is developed to enable accurate assessment and support fine-grained analysis on perception, reasoning, and planning simultaneously. Our comprehensive evaluation of various state-of-the-art MLLMs demonstrates that existing MLLMs show significant deficiencies in perception and planning capabilities. We hope NeSy-Route can support further research and development of more powerful MLLMs for remote sensing.
- Abstract(参考訳): リモートセンシングは、災害救助や環境調査など、複雑な場面や制約を理解し、信頼できる意思決定を行うための重要な応用となる。
現在のリモートセンシングベンチマークは、主にマルチモーダル大言語モデル(MLLM)の知覚と推論能力の評価に焦点を当てている。
彼らは計画能力を評価するのに失敗し、スケールでの計画タスクのキュレーションと検証の難しさや、不正確で不十分な評価プロトコルから起因しています。
これらの制約に対処するため、リモートセンシングにおける制約された経路計画のための大規模なニューロシンボリック・ベンチマークであるNeSy-Routeを導入する。
本ベンチマークでは,高忠実度セマンティックマスクとヒューリスティック検索を統合し,最適解を用いた多様な経路計画タスクを生成する自動データ生成フレームワークを提案する。
これによりNeSy-Routeは10,821のルート計画サンプルを網羅的に評価できる。
さらに,3段階の階層的ニューロシンボリック評価プロトコルを開発し,正確な評価と,知覚,推論,計画のきめ細かい分析を同時に支援する。
各種最先端MLLMの総合評価の結果,既存のMLLMは認識能力や計画能力に重大な欠陥があることが判明した。
NeSy-Routeは、リモートセンシングのためのより強力なMLLMの研究と開発を支援することを願っている。
関連論文リスト
- Scaling Multi-Agent Epistemic Planning through GNN-Derived Heuristics [0.9786469751894747]
マルチエージェント・エピステミック・プランニング(Multi-agent Epistemic Planning、MEP)は、物理的世界とエージェントの信念の両方を推論するための自律的な計画フレームワークである。
MEPでは、状態はKripke構造、すなわち有向ラベル付きグラフとして表現する必要がある。
我々は、グラフニューラルネットワーク(GNN)を用いて、てんかん状態のパターンや関係構造を学習し、計画プロセスの導出を行う。
論文 参考訳(メタデータ) (2025-08-18T11:26:20Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - LLM-SAP: Large Language Models Situational Awareness Based Planning [0.0]
我々は、潜在的なリスクを予測し、積極的に軽減する方法論を開発するために、マルチエージェント推論フレームワークを使用します。
提案手法は,人間中心のインタラクションの複雑さを計画プロセスに組み込むことによって,従来のオートマトン理論から分岐する。
論文 参考訳(メタデータ) (2023-12-26T17:19:09Z) - The efficacy of Neural Planning Metrics: A meta-analysis of PKL on
nuScenes [77.83263286776938]
自律運転(AD)における高性能物体検出システムの役割
通常、平均的精度で評価されるパフォーマンスは、シーン内のアクターの向きや距離を考慮していない。
近年、フィリオンらは、プランナーの軌道と基底経路のKL分散に基づく神経計画測度(PKL)を提案した。
論文 参考訳(メタデータ) (2020-10-19T09:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。