論文の概要: AeroDuo: Aerial Duo for UAV-based Vision and Language Navigation
- arxiv url: http://arxiv.org/abs/2508.15232v1
- Date: Thu, 21 Aug 2025 04:43:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.185303
- Title: AeroDuo: Aerial Duo for UAV-based Vision and Language Navigation
- Title(参考訳): AeroDuo:UAVベースの視覚と言語ナビゲーションのための空中デュオ
- Authors: Ruipu Wu, Yige Zhang, Jinyu Chen, Linjiang Huang, Shifeng Zhang, Xu Zhou, Liang Wang, Si Liu,
- Abstract要約: 航空ビジョン・アンド・ランゲージナビゲーション(Aerial Vision-and-Language Navigation、VLN)は、無人航空機(Unmanned Aerial Vehicles、UAV)が自然言語命令と視覚的手がかりを用いて屋外環境をナビゲートすることを可能にする新しいタスクである。
我々はDuAl-VLN(DuAl-VLN)と呼ばれる新しいタスクを導入する。
このタスクでは、2つのUAVが異なる高度で運用される: 広範囲の環境推論に責任を負う高高度UAVと、正確なナビゲーションを行う低高度UAVである。
- 参考スコア(独自算出の注目度): 34.63571674882289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aerial Vision-and-Language Navigation (VLN) is an emerging task that enables Unmanned Aerial Vehicles (UAVs) to navigate outdoor environments using natural language instructions and visual cues. However, due to the extended trajectories and complex maneuverability of UAVs, achieving reliable UAV-VLN performance is challenging and often requires human intervention or overly detailed instructions. To harness the advantages of UAVs' high mobility, which could provide multi-grained perspectives, while maintaining a manageable motion space for learning, we introduce a novel task called Dual-Altitude UAV Collaborative VLN (DuAl-VLN). In this task, two UAVs operate at distinct altitudes: a high-altitude UAV responsible for broad environmental reasoning, and a low-altitude UAV tasked with precise navigation. To support the training and evaluation of the DuAl-VLN, we construct the HaL-13k, a dataset comprising 13,838 collaborative high-low UAV demonstration trajectories, each paired with target-oriented language instructions. This dataset includes both unseen maps and an unseen object validation set to systematically evaluate the model's generalization capabilities across novel environments and unfamiliar targets. To consolidate their complementary strengths, we propose a dual-UAV collaborative VLN framework, AeroDuo, where the high-altitude UAV integrates a multimodal large language model (Pilot-LLM) for target reasoning, while the low-altitude UAV employs a lightweight multi-stage policy for navigation and target grounding. The two UAVs work collaboratively and only exchange minimal coordinate information to ensure efficiency.
- Abstract(参考訳): 航空ビジョン・アンド・ランゲージナビゲーション(Aerial Vision-and-Language Navigation、VLN)は、無人航空機(Unmanned Aerial Vehicles、UAV)が自然言語命令と視覚的手がかりを用いて屋外環境をナビゲートすることを可能にする新しいタスクである。
しかし、UAVの軌道の延長と複雑な操作性のため、信頼性の高いUAV-VLNの性能を達成することは困難であり、しばしば人間の介入や過剰な詳細な指示を必要とする。
学習のための管理可能な運動空間を維持しつつ,多面的な視点を提供することのできるUAVの高モビリティの利点を活用するために,DuAl-VLN(DuAl-VLN)と呼ばれる新しいタスクを導入する。
このタスクでは、2つのUAVが異なる高度で運用される: 広範囲の環境推論に責任を負う高高度UAVと、正確なナビゲーションを行う低高度UAVである。
我々は,DuAl-VLNのトレーニングと評価を支援するために,13,838個の高高度UAV実証軌道からなるデータセットであるHaL-13kを構築した。
このデータセットには、未知のマップと未知のオブジェクト検証セットの両方が含まれており、新しい環境と未知のターゲットをまたいだモデルの一般化能力を体系的に評価する。
相補的強みの強化を目的として,高高度UAVがターゲット推論のために多モード大言語モデル(Pilot-LLM)を統合し,低高度UAVがナビゲーションと目標接地のために軽量な多段階ポリシーを採用する,二重UAV協調型VLNフレームワークであるAeroDuoを提案する。
2機のUAVは協力して動作し、最小限の座標情報を交換するだけで効率を確保できる。
関連論文リスト
- UAV-Flow Colosseo: A Real-World Benchmark for Flying-on-a-Word UAV Imitation Learning [39.07541452390107]
無人航空機(UAV)は言語と対話するプラットフォームへと進化し、より直感的な人間とドローンの相互作用を可能にしている。
本研究では,この問題をFlying-on-a-Word(Flow)タスクとして形式化し,UAV模倣学習を効果的なアプローチとして導入する。
UAV-Flowは, 言語条件付き, きめ細かいUAV制御のための, 世界初の実世界のベンチマークである。
論文 参考訳(メタデータ) (2025-05-21T16:31:28Z) - UAV-VLN: End-to-End Vision Language guided Navigation for UAVs [0.0]
AI誘導の自律性における中核的な課題は、エージェントが以前見えなかった環境で現実的で効果的にナビゲートできるようにすることである。
UAV-VLNは無人航空機(UAV)のための新しいエンドツーエンドビジョンランゲージナビゲーションフレームワークである。
本システムでは,自由形式の自然言語命令を解釈し,視覚的観察に利用し,多様な環境下で実現可能な航空軌道を計画する。
論文 参考訳(メタデータ) (2025-04-30T08:40:47Z) - More Clear, More Flexible, More Precise: A Comprehensive Oriented Object Detection benchmark for UAV [58.89234732689013]
CODroneは、現実の状況を正確に反映した、UAVのための包括的なオブジェクト指向オブジェクト検出データセットである。
また、下流のタスク要求に合わせて設計された新しいベンチマークとしても機能する。
我々は、CODroneを厳格に評価するために、22の古典的またはSOTA法に基づく一連の実験を行う。
論文 参考訳(メタデータ) (2025-04-28T17:56:02Z) - Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology [38.2096731046639]
UAV視覚言語ナビゲーションにおける最近の取り組みは、主に地上ベースのVLN設定を採用する。
プラットフォーム,ベンチマーク,方法論という3つの観点からのソリューションを提案する。
論文 参考訳(メタデータ) (2024-10-09T17:29:01Z) - Evidential Detection and Tracking Collaboration: New Problem, Benchmark
and Algorithm for Robust Anti-UAV System [56.51247807483176]
無人航空機(UAV)は輸送、監視、軍事など多くの地域で広く使われている。
従来は、UAVの先行情報が常に提供されていた追跡問題として、このようなアンチUAVタスクを単純化していた。
本稿では,従来のUAV情報を含まない複雑な場面において,UAVの認識を特徴とする新しい実用的対UAV問題を初めて定式化する。
論文 参考訳(メタデータ) (2023-06-27T19:30:23Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。