論文の概要: CoDrone: Autonomous Drone Navigation Assisted by Edge and Cloud Foundation Models
- arxiv url: http://arxiv.org/abs/2512.19083v2
- Date: Wed, 24 Dec 2025 02:49:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.463096
- Title: CoDrone: Autonomous Drone Navigation Assisted by Edge and Cloud Foundation Models
- Title(参考訳): CoDrone:エッジとクラウドファウンデーションモデルによる自律ドローンナビゲーション
- Authors: Pengyu Chen, Tao Ouyang, Ke Luo, Weijie Hong, Xu Chen,
- Abstract要約: CoDroneはクラウドとバックエンドのコラボレーティブコンピューティングフレームワークで、ファンデーションモデルを自律的なUAVクルーズシナリオに統合する。
CoDroneは飛行速度やネットワーク条件の異なるベースライン法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 14.446914221286002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous navigation for Unmanned Aerial Vehicles faces key challenges from limited onboard computational resources, which restrict deployed deep neural networks to shallow architectures incapable of handling complex environments. Offloading tasks to remote edge servers introduces high latency, creating an inherent trade-off in system design. To address these limitations, we propose CoDrone - the first cloud-edge-end collaborative computing framework integrating foundation models into autonomous UAV cruising scenarios - effectively leveraging foundation models to enhance performance of resource-constrained unmanned aerial vehicle platforms. To reduce onboard computation and data transmission overhead, CoDrone employs grayscale imagery for the navigation model. When enhanced environmental perception is required, CoDrone leverages the edge-assisted foundation model Depth Anything V2 for depth estimation and introduces a novel one-dimensional occupancy grid-based navigation method - enabling fine-grained scene understanding while advancing efficiency and representational simplicity of autonomous navigation. A key component of CoDrone is a Deep Reinforcement Learning-based neural scheduler that seamlessly integrates depth estimation with autonomous navigation decisions, enabling real-time adaptation to dynamic environments. Furthermore, the framework introduces a UAV-specific vision language interaction module incorporating domain-tailored low-level flight primitives to enable effective interaction between the cloud foundation model and the UAV. The introduction of VLM enhances open-set reasoning capabilities in complex unseen scenarios. Experimental results show CoDrone outperforms baseline methods under varying flight speeds and network conditions, achieving a 40% increase in average flight distance and a 5% improvement in average Quality of Navigation.
- Abstract(参考訳): Unmanned Aerial Vehiclesの自律ナビゲーションは、デプロイされたディープニューラルネットワークを複雑な環境を扱うことができない浅いアーキテクチャに制限する、オンボードの計算リソースの制限による重要な課題に直面している。
タスクをリモートエッジサーバにオフロードするとレイテンシが高くなり、システム設計に固有のトレードオフが生じます。
これらの制限に対処するため、CoDroneは、ファンデーションモデルを自律的なUAVクルーズシナリオに統合した、最初のクラウド-エッジのコラボレーティブコンピューティングフレームワークである。
オンボード計算とデータ転送オーバーヘッドを低減するため、CoDroneはナビゲーションモデルにグレースケールのイメージを使用している。
環境認識の強化が必要な場合、CoDroneは深度推定のためにエッジ支援基盤モデルDepth Anything V2を活用し、自律ナビゲーションの効率と表現的単純さを向上しつつ、きめ細かなシーン理解を可能にする新しい1次元占有グリッドベースのナビゲーション手法を導入する。
CoDroneの重要なコンポーネントは、Deep Reinforcement Learningベースのニューラルスケジューラである。
さらに、このフレームワークは、クラウド基盤モデルとUAVとの効果的な相互作用を可能にするために、ドメインに適した低レベル飛行プリミティブを組み込んだUAV固有の視覚言語相互作用モジュールを導入している。
VLMの導入は、複雑な未確認シナリオにおけるオープンセット推論機能を強化する。
実験の結果,CoDroneは飛行速度やネットワーク条件の異なるベースライン法より優れ,平均飛行距離は40%,平均航法品質は5%向上した。
関連論文リスト
- AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild [62.47761809929869]
視覚言語ナビゲーション(VLN)は、視覚的観察とともに言語指示を解釈することで、知的エージェントが環境をナビゲートする必要がある。
無人航空機(UAV)の現在のVLN研究は、所定のルートに沿ってUAVを誘導するための詳細な指示に依存している。
本稿では,自律型UAVナビゲーションのためのエンド・ツー・エンドのビジョン・ランゲージ・アクションモデルであるAutoFlyを提案する。
論文 参考訳(メタデータ) (2026-02-10T11:08:07Z) - VLA-AN: An Efficient and Onboard Vision-Language-Action Framework for Aerial Navigation in Complex Environments [12.689250855332569]
VLA-ANは、複雑な環境での自律ドローンナビゲーションに特化したフレームワークである。
既存の大型航法モデルの4つの大きな制限に対処する。
シングルタスクの成功率は98.1%に達する。
論文 参考訳(メタデータ) (2025-12-17T10:02:55Z) - Development and Testing for Perception Based Autonomous Landing of a Long-Range QuadPlane [0.0]
本研究は,視覚に基づく自律着陸と視覚慣性オドメトリーのための軽量なQuadPlaneシステムを提案する。
ハードウェアプラットフォーム、センサー構成、組み込みコンピューティングアーキテクチャは、要求されるリアルタイム、物理的制約を満たすように設計されている。
論文 参考訳(メタデータ) (2025-12-10T06:02:25Z) - Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization [61.55616421408666]
低高度経済ネットワーク(LAENets)は、航空監視、環境検知、セマンティックデータ収集など、様々な応用を可能にしている。
オンボードビジョン(VLM)は、リアルタイムな推論を提供するが、オンボードの動的ネットワーク条件は限られている。
動的LEENet条件下での通信効率を向上させるUAV対応LEENetシステムを提案する。
論文 参考訳(メタデータ) (2025-10-11T05:11:21Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。
SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。
また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - A3D: Adaptive, Accurate, and Autonomous Navigation for Edge-Assisted
Drones [12.439787085435661]
本稿では,エッジサーバによるドローンナビゲーションフレームワークであるA3Dを提案する。
A3Dは、非適応的なソリューションと比較して、エンドツーエンドのレイテンシを28.06%削減し、フライト距離を27.28%まで拡張することができる。
論文 参考訳(メタデータ) (2023-07-19T10:23:28Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。