論文の概要: SAGA: A Robust Self-Attention and Goal-Aware Anchor-based Planner for Safe UAV Autonomous Navigation
- arxiv url: http://arxiv.org/abs/2605.02301v1
- Date: Mon, 04 May 2026 07:48:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.18193
- Title: SAGA: A Robust Self-Attention and Goal-Aware Anchor-based Planner for Safe UAV Autonomous Navigation
- Title(参考訳): SAGA: 安全な無人航法のためのロバストな自己注意と目標認識アンカーベースのプランナー
- Authors: Junhao Wei, Yanxiao Li, Dexing Yao, Yifu Zhao, Haochen Li, Qibin He, Baili Lu, Xiaofan Zou, Dingcheng Yang, Sio-Kei Im, Yapeng Wang, Xu Yang,
- Abstract要約: 本稿では,安全無人航法のためのロバストな自己注意型アンカーベースプランナーSAGAを提案する。
SAGAは、固定された動きアンカーの格子上での1段階の関節回帰・ランク問題として局所計画を定式化する。
最大速度設定は2.0, 3.0, 4.0m/sで、SAGAは100%の成功率を一貫して達成している。
- 参考スコア(独自算出の注目度): 12.127732071545195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agile unmanned aerial vehicle (UAV) navigation in cluttered environments demands a planning architecture that is both computationally efficient and structurally expressive enough to reason over multiple feasible motions. This paper presents SAGA, a robust self-attention and goal-aware anchor-based planner for safe UAV autonomous navigation. SAGA formulates local planning as a one-stage joint regression-and-ranking problem over a fixed lattice of motion anchors. Given a depth image and a body-frame motion state, the planner predicts refined terminal states and planning scores for all anchors in a single forward pass, after which the best candidate is decoded into a dynamically feasible trajectory. The key idea of SAGA is to transform anchor-aligned features into geometry-aware tokens and perform cross-anchor global reasoning with self-attention. To preserve directional structure in the token space, we further introduce a polar positional encoding derived from anchor yaw and pitch. In addition, a goal-aware modulation module injects velocity, acceleration, and target information into the token representation before final score prediction. Experiments in cluttered pillar-map environments under maximum speed settings of 2.0, 3.0, and 4.0~m/s show that SAGA consistently achieves a 100\% success rate, while YOPO drops from 90.91\% to 62.50\%, Ego-planner from 71.43\% to 52.63\%, and Fast-planner from 52.63\% to 38.46\%. Under the 4.0~m/s maximum speed setting, SAGA also improves average safety from 1.9843~m to 2.3888~m and minimum safety from 0.4390~m to 0.7576~m over YOPO, while reducing total flight time from 40.4631~s to 27.4901~s. The comparison with SAGA w/o PPE further shows that explicit polar positional encoding is critical for stable cross-anchor reasoning and safe passage selection in cluttered scenes.
- Abstract(参考訳): 乱雑な環境でのアジャイル無人航空機(UAV)ナビゲーションは、計算的に効率的かつ構造的に表現可能な計画アーキテクチャを必要とする。
本稿では,安全無人航法のためのロバストな自己注意型アンカーベースプランナーSAGAを提案する。
SAGAは、固定された動きアンカーの格子上での1段階の関節回帰・ランク問題として局所計画を定式化する。
プランナーは、深度画像と体枠運動状態とを与えられた後、単一の前方通過における全てのアンカーの洗練された端末状態と計画スコアを予測し、その後、最良の候補を動的に実行可能な軌道に復号する。
SAGAの鍵となる考え方は、アンカー整列した特徴を幾何学的に認識されたトークンに変換し、自己注意で世界横断推論を実行することである。
トークン空間における方向構造を維持するために、アンカーヨーとピッチから導かれる極位置符号化を導入する。
さらに、ゴール認識変調モジュールは、最終スコア予測の前にトークン表現に速度、加速度、目標情報を注入する。
最大速度設定2.0, 3.0, 4.0~m/sでの散逸した柱マップ環境の実験では、SAGAは一貫して100\%の成功率を達成し、YOPOは90.91\%から62.50\%に、エゴプランナーは71.43\%から52.63\%に、ファストプランナーは52.63\%から38.46\%に低下した。
4.0~m/sの最高速度設定では、SAGAは平均安全性を1.9843~mから2.3888〜mに改善し、最小安全性を0.4390〜mから0.7576〜mに改善し、総飛行時間は40.4631〜sから27.4901〜sに短縮した。
さらに、SAGA w/o PPEとの比較により、散在シーンにおける安定なクロスアンカー推論と安全な通過選択において、明示的な極位置符号化が重要であることが示された。
関連論文リスト
- Instance-level Visual Active Tracking with Occlusion-Aware Planning [61.982298426203165]
Visual Active Tracking (VAT)は、カメラを3D空間でターゲットに追従することを目的としている。
VATは、視覚的に類似したイントラクタからの混乱と、閉塞下での深刻な障害という、現実世界のデプロイメントにおいて2つの重要なボトルネックに直面している。
3つの相補的なモジュールを持つ統一パイプラインであるOA-VATを提案する。
論文 参考訳(メタデータ) (2026-04-23T09:11:50Z) - Real-Time Branch-to-Tool Distance Estimation for Autonomous UAV Pruning: Benchmarking Five DEFOM-Stereo Variants from Simulation to Jetson Deployment [5.266753902938501]
タスク固有の合成データセット上でDEFOM-Stereoの5つの変種をトレーニングし、NVIDIA Jetson Orin Super 16 GB上でチェックポイントをデプロイする。
トレーニングコーパスはUnreal Engine 5で構築され、シミュレーションされたZED Miniステレオカメラ5,520台のステレオペアが115本のツリーインスタンスに2mの距離で3つの視点から配置されている。
DeFOM-PrunePlusは車載距離推定に最も実用的な精度-レイテンシバランスを提供する。
論文 参考訳(メタデータ) (2026-03-27T10:16:39Z) - Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection [52.551864761088574]
大規模言語モデル(LLM)は、しばしばアライメント税を課す。
この税は、主に連続的な順序で学習スタイルを忘れることから生じると我々は主張する。
我々は, 塑性と安定性のバランスをとるために, OGPSA (Orthogonal Gradient Projection for Safety Alignment) を提案する。
論文 参考訳(メタデータ) (2026-02-08T09:53:46Z) - SpaRC-AD: A Baseline for Radar-Camera Fusion in End-to-End Autonomous Driving [5.343552118560704]
SpaRC-ADは、計画指向の自律運転のためのクエリベースのエンドツーエンドカメラレーダ融合フレームワークである。
本手法は、複数の自律運転タスクにおいて、最先端のビジョンのみのベースラインよりも強力な改善を実現する。
論文 参考訳(メタデータ) (2025-08-14T12:02:41Z) - Stable at Any Speed: Speed-Driven Multi-Object Tracking with Learnable Kalman Filtering [5.852380432257675]
マルチオブジェクトトラッキング(MOT)により、自動運転車は動的物体を継続的に知覚することができる。
Speed-Guided Learnable Kalman Filter (SG-LKF)は、エゴ車速に不確実性を適用し、高ダイナミックなシナリオにおける安定性と精度を著しく向上する。
SG-LKF は KITTI 2D MOT の79.59% HOTA で全ての視覚ベースの手法の中で第1位であり、KITTI 3D MOT では 82.03% HOTA で強い結果を出し、nuScenes 3D MOT では SimpleTrack を 2.2% AMOTA で上回っている。
論文 参考訳(メタデータ) (2025-08-01T06:42:33Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - ET-Former: Efficient Triplane Deformable Attention for 3D Semantic Scene Completion From Monocular Camera [53.20087549782785]
本稿では,単一単眼カメラを用いたセマンティックシーン補完のための新しいエンドツーエンドアルゴリズムET-Formerを紹介する。
本手法は,単一のRGB観測からセマンティック占有マップを生成すると同時に,セマンティック予測のための不確実性推定を行う。
論文 参考訳(メタデータ) (2024-10-14T19:14:49Z) - Learning Global Structure Consistency for Robust Object Tracking [57.736915865309165]
この作品は、シーン全体の即時的なバリエーションを考慮に入れている。
本稿では,グローバルな構造的一貫性を短時間で活用する方法を学習する,効率的かつ効率的な短期モデルを提案する。
提案したトラッカーが2つの挑戦シナリオに対処し,大規模ベンチマークで検証できることを実証的に検証する。
論文 参考訳(メタデータ) (2020-08-26T19:12:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。