論文の概要: Bridging Perception and Reasoning: Dual-Pipeline Neuro-Symbolic Landing for UAVs in Cluttered Environments
- arxiv url: http://arxiv.org/abs/2510.22204v1
- Date: Sat, 25 Oct 2025 08:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 17:41:21.944612
- Title: Bridging Perception and Reasoning: Dual-Pipeline Neuro-Symbolic Landing for UAVs in Cluttered Environments
- Title(参考訳): ブリジング・パーセプションと推論:二管型ニューロシンボリックランディングによる混成環境下でのUAV観測
- Authors: Weixian Qian, Sebastian Schroder, Yao Deng, Jiaohong Yao, Linfeng Liang, Xiao Cheng, Richard Han, Xi Zheng,
- Abstract要約: NeuroSymLandは、非構造環境における自律着陸のためのニューロシンボリックフレームワークである。
これは、軽量基礎モデルの知覚的強みと象徴的推論の解釈可能性と検証可能性を組み合わせる。
NeuroSymLandは、最先端のベースラインに比べて高精度で、共変量シフトに対する強い堅牢性、効率性の向上を実現している。
- 参考スコア(独自算出の注目度): 3.2786408034656858
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous landing in unstructured (cluttered, uneven, and map-poor) environments is a core requirement for Unmanned Aerial Vehicles (UAVs), yet purely vision-based or deep learning models often falter under covariate shift and provide limited interpretability. We propose NeuroSymLand, a neuro-symbolic framework that tightly couples two complementary pipelines: (i) an offline pipeline, where Large Language Models (LLMs) and human-in-the-loop refinement synthesize Scallop code from diverse landing scenarios, distilling generalizable and verifiable symbolic knowledge; and (ii) an online pipeline, where a compact foundation-based semantic segmentation model generates probabilistic Scallop facts that are composed into semantic scene graphs for real-time deductive reasoning. This design combines the perceptual strengths of lightweight foundation models with the interpretability and verifiability of symbolic reasoning. Node attributes (e.g., flatness, area) and edge relations (adjacency, containment, proximity) are computed with geometric routines rather than learned, avoiding the data dependence and latency of train-time graph builders. The resulting Scallop program encodes landing principles (avoid water and obstacles; prefer large, flat, accessible regions) and yields calibrated safety scores with ranked Regions of Interest (ROIs) and human-readable justifications. Extensive evaluations across datasets, diverse simulation maps, and real UAV hardware show that NeuroSymLand achieves higher accuracy, stronger robustness to covariate shift, and superior efficiency compared with state-of-the-art baselines, while advancing UAV safety and reliability in emergency response, surveillance, and delivery missions.
- Abstract(参考訳): 無人航空機(Unmanned Aerial Vehicles、UAV)では、非構造的(散在的、不均一で、地図が不均一な)環境における自律着陸は、中核的な要件であるが、純粋に視覚に基づく、あるいは深層学習モデルは、しばしば共変量シフトの下で不安定であり、限定的な解釈性を提供する。
我々は2つの相補的なパイプラインを緊密に結合するニューロシンボリック・フレームワークであるNeuroSymLandを提案する。
(i)大型言語モデル(LLM)と人為的ループ改良が多様な着陸シナリオからScallopコードを合成し、一般化可能で検証可能な記号知識を蒸留するオフラインパイプライン。
(II) オンラインパイプラインにおいて,コンパクトな基盤に基づくセマンティックセマンティックセマンティクスモデルにより,実時間推論のためのセマンティクスシーングラフを構成する確率的スカルロップ事実を生成する。
この設計は、軽量基礎モデルの知覚的強みと象徴的推論の解釈可能性と検証可能性を組み合わせる。
ノード属性(例えば、平坦性、領域)とエッジ関係(隣接性、封じ込め、近接性)は、学習するよりも幾何学的なルーチンで計算される。
Scallopプログラムは、着陸原則(水と障害物を伴わない、大きくて平らでアクセスしやすい地域を好む)を符号化し、格付けされた安全スコアを利子地域(ROI)と人間可読な正当性で取得する。
データセット、多様なシミュレーションマップ、実際のUAVハードウェアにわたる広範囲な評価によると、NeuroSymLandは、緊急対応、監視、配送ミッションにおいてUAVの安全性と信頼性を向上しつつ、高い精度、コ変量シフトに対する強い堅牢性、そして最先端のベースラインよりも優れた効率を達成する。
関連論文リスト
- Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Bayesian-Driven Graph Reasoning for Active Radio Map Construction [96.08082552413117]
本稿では,経路ナビゲーションに適したグラフベースの推論を明示的に活用する不確実性を考慮した無線地図再構成フレームワークを提案する。
提案手法は,(1)空間的不確実性をリアルタイムで推定するベイズニューラルネットワーク,(2)グローバル推論を行う注意に基づく強化学習ポリシの2つの重要な深層学習要素を統合した。
実験の結果,URAMは既存のベースラインよりも最大で34%の精度で復元できることがわかった。
論文 参考訳(メタデータ) (2025-07-29T03:32:01Z) - The Role of Foundation Models in Neuro-Symbolic Learning and Reasoning [54.56905063752427]
Neuro-Symbolic AI(NeSy)は、AIシステムの安全なデプロイを保証することを約束している。
ニューラルネットワークとシンボリックコンポーネントを順次トレーニングする既存のパイプラインは、広範なラベリングを必要とする。
新しいアーキテクチャであるNeSyGPTは、生データから象徴的特徴を抽出する視覚言語基盤モデルを微調整する。
論文 参考訳(メタデータ) (2024-02-02T20:33:14Z) - Combating Bilateral Edge Noise for Robust Link Prediction [56.43882298843564]
本稿では,RGIB(Robust Graph Information Bottleneck)という情報理論の原則を提案し,信頼性の高い監視信号を抽出し,表現の崩壊を回避する。
RGIB-SSLとRGIB-REPの2つのインスタンス化は、異なる手法の利点を活用するために検討されている。
6つのデータセットと3つのGNNの様々なノイズシナリオによる実験は、我々のRGIBインスタンスの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-02T12:47:49Z) - Explainable Spatio-Temporal Graph Neural Networks [16.313146933922752]
本稿では,STGNNを本質的に説明可能な形で拡張する,説明可能な時空間グラフニューラルネットワーク(STGNN)フレームワークを提案する。
本フレームワークは,STGエンコーダとデコーダとして位置情報融合層と統合時間グラフアテンションネットワークを統合した。
予測精度と説明可能性の指標から,STExplainerは最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-26T04:47:28Z) - Strategic Geosteeering Workflow with Uncertainty Quantification and Deep
Learning: A Case Study on the Goliat Field [0.0]
本稿では,オフラインとオンラインのフェーズからなる実践的なワークフローを提案する。
オフラインフェーズには、不確実な事前ニアウェルジオモデルのトレーニングと構築が含まれている。
オンラインフェーズでは、フレキシブルな反復アンサンブルスムーズ(FlexIES)を使用して、極深電磁データのリアルタイム同化を行う。
論文 参考訳(メタデータ) (2022-10-27T15:38:26Z) - Probabilistic forecasting for geosteering in fluvial successions using a
generative adversarial network [0.0]
リアルタイムデータに基づく高速更新は、プレドリルモデルで高い不確実性を持つ複雑な貯水池での掘削に不可欠である。
本稿では, フラビアル継承の地質学的に一貫した2次元断面を再現するためのGAN(generative adversarial Deep Neural Network)を提案する。
この手法は不確実性を低減し, 掘削ビットより500m先にある主要な地質特性を正確に予測する。
論文 参考訳(メタデータ) (2022-07-04T12:52:38Z) - Sign-Agnostic CONet: Learning Implicit Surface Reconstructions by
Sign-Agnostic Optimization of Convolutional Occupancy Networks [39.65056638604885]
畳み込み型ネットワークの符号非依存最適化により暗黙的表面再構成を学習する。
この目標をシンプルで効果的な設計で効果的に達成できることを示す。
論文 参考訳(メタデータ) (2021-05-08T03:35:32Z) - Exploiting latent representation of sparse semantic layers for improved
short-term motion prediction with Capsule Networks [0.12183405753834559]
本稿では,HD(High-Definition)マップの小さな領域に対応するスパースなセマンティクス層の階層的表現を学習する文脈において,Capsule Networks(CapsNets)の利用を検討する。
CapsNetsに基づくアーキテクチャを使用することで、検出された画像内の特徴間の階層的関係を維持すると同時に、プール操作によってしばしば発生する空間データの損失を防ぐことができる。
本モデルでは,ネットワーク全体の規模を大幅に削減しつつ,予測に関する最近の研究よりも大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-03-02T11:13:43Z) - Graph Backdoor [53.70971502299977]
GTAはグラフニューラルネットワーク(GNN)に対する最初のバックドア攻撃である。
GTAは、トポロジカル構造と記述的特徴の両方を含む特定の部分グラフとしてトリガーを定義する。
トランスダクティブ(ノード分類など)とインダクティブ(グラフ分類など)の両方のタスクに対してインスタンス化することができる。
論文 参考訳(メタデータ) (2020-06-21T19:45:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。