論文の概要: SkyShield: Occupancy as a Safety Interface for Low-Altitude UAV Autonomy
- arxiv url: http://arxiv.org/abs/2606.00747v2
- Date: Wed, 03 Jun 2026 09:02:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 17:40:41.581135
- Title: SkyShield: Occupancy as a Safety Interface for Low-Altitude UAV Autonomy
- Title(参考訳): スカイシールド:低高度UAVオートノミーの安全インターフェースとしての利用
- Authors: Jie Gao, Jie Ma, Kaihui Lin, Kai Ye, Miaohui Zhang, Pingyang Dai, Liujuan Cao,
- Abstract要約: 我々はSkyShieldを紹介し、20m未満の都市UAV飛行のための最初のフロントビュー単分子セマンティック占有ベンチマークを私たちの知る限りで紹介する。
CARLA上に構築されたSkyShieldには、様々な都市景観と気象条件にわたる36KのフロントビューUAVサンプルが含まれている。
KAR-mIoU(UAV中心で動的に認識されるメトリクス)は,到達性と協調時間によるボクセルレベルの評価を再重み付けする。
- 参考スコア(独自算出の注目度): 33.9602739552924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For low-altitude Unmanned Aerial Vehicle (UAV) autonomy, 3D spatial understanding is not merely a perception objective, but the safety interface between human instructions and physical flight. In human-scale urban airspace below 20 meters, thin geometry, occlusions, vegetation, and urban clutter define whether an aerial agent can safely enter the space ahead. However, existing UAV datasets mainly provide 2D annotations or 3D boxes, while driving-oriented occupancy benchmarks assume stable ground-level sensor rigs. Both miss the defining regime of low-altitude flight: a front-facing monocular camera observing occupied and free space from a moving aerial body with frame-wise changing 6-DoF pose and camera extrinsics. To bridge this gap, we introduce SkyShield, to the best of our knowledge the first front-view monocular semantic occupancy benchmark for urban UAV flight below 20 meters. Built on CARLA, SkyShield contains 36K front-view UAV samples across diverse urban scenes and weather conditions, pairing each image with frame-wise 6-DoF UAV pose, frame-wise dynamic camera geometry, UAV states, and front-frustum semantic occupancy labels. We further propose KAR-mIoU, a UAV-centric and dynamics-aware metric that re-weights voxel-level evaluation by kinematic reachability and time-to-collision, revealing safety-critical risks hidden by conventional mIoU. To tackle this challenging new setting, we provide SkyOcc, a geometry-first monocular baseline that integrates frame-wise UAV attitude into projection, fuses temporal occupancy features, and applies safety-prior optimization to preserve sparse collision-critical structures. Together, SkyShield, KAR-mIoU, and SkyOcc establish occupancy as a safety interface for low-altitude aerial autonomy. Code and dataset will be released publicly.
- Abstract(参考訳): 低高度無人航空機(UAV)の自律性では、3次元空間理解は単なる知覚目標ではなく、人間の指示と物理的飛行の間の安全インターフェースである。
20メートル以下の都市空間では、細い幾何学、閉塞物、植生、都市ゴミは、航空エージェントが空間に安全に入り込むことができるかどうかを定義している。
しかし、既存のUAVデータセットは主に2Dアノテーションや3Dボックスを提供し、駆動指向の占有ベンチマークは安定した地上レベルのセンサーリグを前提としている。
どちらも低高度飛行における決定的な状況を見落としている。前面の単眼カメラは、フレームワイドに変化する6-DoFポーズとカメラ外装を備えた移動体から占有された自由空間を観察する。
このギャップを埋めるために、SkyShieldを紹介します。私たちの知る限り、20m未満の都市UAV飛行のための最初のフロントビュー単分子セマンティック占有率ベンチマークです。
CARLA上に構築されたSkyShieldには、様々な都市シーンと気象条件の36KのフロントビューUAVサンプルが含まれており、それぞれにフレームワイドの6-DoF UAVポーズ、フレームワイドのダイナミックカメラ幾何学、UAV状態、フロントフラストラムのセマンティック占有ラベルがある。
さらに,KAR-mIoUを提案する。KAR-mIoUは,従来のmIoUで隠蔽された安全クリティカルなリスクを明らかにするために,キネマティックリーチビリティと時間対衝突によるボクセルレベルの評価を再重み付けするUAV中心でダイナミックス対応の指標である。
この課題に対処するため、我々は、フレームワイドUAV姿勢を投影に統合し、時間的占有機能を融合する幾何学第一の単分子基線であるSkyOccを提供し、スパース衝突臨界構造を維持するために安全優先最適化を適用した。
SkyShield、KAR-mIoU、SkyOccが共同で、低高度自律飛行のための安全インターフェースとして占有権を確立した。
コードとデータセットは公開される。
関連論文リスト
- Are VLMs Lost Between Sky and Space? LinkS$^2$Bench for UAV-Satellite Dynamic Cross-View Spatial Intelligence [107.79496500634691]
LinkS$2$Benchは、ダイナミックUAV映像の1,022分を200km$2$の高解像度衛星画像とリンクする。
LMMを用いたパイプラインと厳密な人間のアノテーションを用いて17.9kの高品質な質問応答ペアを構築した。
評価は、人間のベースラインとはかなりの差を示し、正確なクロスビューのダイナミックアライメントを重要なボトルネックと特定する。
論文 参考訳(メタデータ) (2026-04-02T13:22:57Z) - OccuFly: A 3D Vision Benchmark for Semantic Scene Completion from the Aerial Perspective [44.84496929237721]
OccuFlyは、50m、40m、30mの高度で撮影される、世界初の実世界のカメラベースの空中セマンティックシーン補完ベンチマークである。
本稿では,カメラのモダリティに基づくLiDARフリーなデータ生成フレームワークを提案する。
我々はOccuFlyの最先端をベンチマークし、高い視点に特有な課題を強調します。
論文 参考訳(メタデータ) (2025-12-23T21:14:55Z) - UAV-MM3D: A Large-Scale Synthetic Benchmark for 3D Perception of Unmanned Aerial Vehicles with Multi-Modal Data [47.317955428393134]
UAV-MM3Dは,低高度UAV知覚と動作理解のための多モード合成データセットである。
様々なシーン(都市部、郊外部、森林部、沿岸部)と気象条件にまたがる400Kの同期フレームで構成されている。
各フレームは2D/3Dバウンディングボックス、6-DoFのポーズ、インスタンスレベルのアノテーションを提供し、3D検出、ポーズ推定、ターゲット追跡、短期軌道予測などのUAVに関連するコアタスクを可能にする。
論文 参考訳(メタデータ) (2025-11-27T12:30:28Z) - SkyVLN: Vision-and-Language Navigation and NMPC Control for UAVs in Urban Environments [7.251041314934871]
無人航空機(UAV)は、移動性と適応性によって、様々な分野にまたがって多用途のツールとして登場した。
本稿では,複雑な都市環境下でのUAV自律性を高めるために,VLNとモデル予測制御(NMPC)を統合した新しいフレームワークであるSkyVLNを紹介する。
論文 参考訳(メタデータ) (2025-07-09T05:38:32Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - Segmentation of Drone Collision Hazards in Airborne RADAR Point Clouds
Using PointNet [0.7067443325368975]
統合のための重要な前提条件は、安全な運用を確保するために、状況認識を増強したUAVを装備することである。
本研究は,複数の衝突リスクを同時に識別するために,レーダ技術を活用した航空点雲のエンドツーエンドセマンティックセマンティックセマンティックセグメンテーションを実現する。
我々の知る限り、これは空中における複数の衝突脅威の同時識別に対処する最初のアプローチであり、94%の精度を達成する。
論文 参考訳(メタデータ) (2023-11-06T16:04:58Z) - Real-Time Hybrid Mapping of Populated Indoor Scenes using a Low-Cost
Monocular UAV [42.850288938936075]
単一UAVに搭載された単眼カメラから同時マッピングと複数人によるポーズ推定を行う最初のシステムを提案する。
特に,身近な室内シーンのハイブリッドマップをリアルタイムに再構築するために,最先端のモノキュラー深度推定とモノキュラー人間のポーズ推定を緩やかに組み合わせる方法について述べる。
論文 参考訳(メタデータ) (2022-03-04T17:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。