論文の概要: AeroGen: Agentic Drone Autonomy through Single-Shot Structured Prompting & Drone SDK
- arxiv url: http://arxiv.org/abs/2603.14236v1
- Date: Sun, 15 Mar 2026 06:16:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.820162
- Title: AeroGen: Agentic Drone Autonomy through Single-Shot Structured Prompting & Drone SDK
- Title(参考訳): AeroGen:シングルショット構造型プロンプティングとドローンSDKによるエージェントドローンの自律性
- Authors: Kautuk Astu, Yogesh Simmhan,
- Abstract要約: AeroGenは、一貫した正しい単発AI生成ドローン制御プログラムを可能にするオープンループフレームワークである。
実環境とシミュレーションの両方において,AeroGenが約40行のAeroD Pythonコードを生成することを示す。
- 参考スコア(独自算出の注目度): 3.1941554288428193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing correct UAV autonomy programs is challenging due to joint navigation, sensing and analytics requirements. While LLMs can generate code, their reliability for safety-critical UAVs remains uncertain. This paper presents AeroGen, an open-loop framework that enables consistently correct single-shot AI-generated drone control programs through structured guardrail prompting and integration with the AeroDaaS drone SDK. AeroGen encodes API descriptions, flight constraints and operational world rules directly into the system context prompt, enabling generic LLMs to produce constraint-aware code from user prompts, with minimal example code. We evaluate AeroGen across a diverse benchmark of 20 navigation tasks and 5 drone missions on urban, farm and inspection environments, using both imperative and declarative user prompts. AeroGen generates about 40 lines of AeroDaaS Python code in about 20s per mission, in both real-world and simulations, showing that structured prompting with a well-defined SDK improves robustness, correctness and deployability of LLM-generated drone autonomy programs.
- Abstract(参考訳): UAVの自律プログラムを正しく設計することは、共同ナビゲーション、センシング、分析の要求のために困難である。
LLMはコードを生成することができるが、安全上重要なUAVの信頼性は依然として不明である。
本稿では,AeroDaaSドローンSDKのプロンプトと統合により,構造化されたガードレールを介して一貫した単発AI生成ドローン制御プログラムを可能にするオープンループフレームワークであるAeroGenを提案する。
AeroGenはAPI記述、フライト制約、運用の世界ルールを直接システムコンテキストプロンプトにエンコードすることで、ジェネリックLLMが最小のサンプルコードでユーザプロンプトから制約対応コードを生成することができる。
我々は,都市,農地,検査環境における20のナビゲーションタスクと5つのドローンミッションの多様なベンチマークを,命令型および宣言型両方のユーザプロンプトを用いて評価した。
AeroGenはミッション毎に約40行のAeroDaaS Pythonコードを、実世界とシミュレーションの両方で生成し、明確に定義されたSDKによる構造化プロンプトによって、LLM生成のドローン自律プログラムの堅牢性、正確性、デプロイ性が向上することを示している。
関連論文リスト
- VLN-Pilot: Large Vision-Language Model as an Autonomous Indoor Drone Operator [1.4878644292213625]
VLN-Pilot(VLN-Pilot)は、大型のビジョン・アンド・ランゲージ・モデル(Vision-and-Language Model)が屋内ドローンナビゲーションにおいて人間のパイロットの役割を担っているフレームワークである。
我々のフレームワークは、言語による意味理解と視覚的知覚を統合し、文脈認識、高レベルの飛行行動を可能にする。
論文 参考訳(メタデータ) (2026-02-05T11:23:11Z) - UAVBench: An Open Benchmark Dataset for Autonomous and Agentic AI UAV Systems via LLM-Generated Flight Scenarios [3.099103925863002]
UAVBenchは、大規模言語モデル(LLM)によって生成されたUAV飛行シナリオのオープンベンチマークベンチマークである。
UAVBench_MCQは,10の認知的・倫理的推論スタイルにまたがる5万の多重選択質問を含む推論指向の拡張である。
GPT-5, ChatGPT-4o, Gemini 2.5 Flash, DeepSeek V3, Q3wenwenB, ERNIE 4.5 300B を含む32 の最先端 LLM を評価し, 認識・政策推論において高い性能を示した。
論文 参考訳(メタデータ) (2025-11-14T12:51:48Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - AirPilot: Interpretable PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights [0.046873264197900916]
AirPilotは、非線形ディープ強化学習 (DRL) - プロポーショナル・インテグレーショナル・デリバティブ (PID) ドローン・コントローラである。
AirPilotコントローラは、従来のPID制御のシンプルさと有効性と、DRLの適応性、学習能力、最適化能力を組み合わせる。
Airpilotは、デフォルトのPX4 PID位置コントローラのナビゲーションエラーを90%削減し、微調整されたPIDコントローラのナビゲーション速度を21%改善する。
論文 参考訳(メタデータ) (2024-03-30T00:46:43Z) - Multi-model fusion for Aerial Vision and Dialog Navigation based on
human attention aids [69.98258892165767]
本稿では,2023年ICCV会話史のための航空航法課題について述べる。
本稿では,人間注意支援型トランスフォーマモデル(HAA-Transformer)と人間注意支援型LSTMモデル(HAA-LSTM)の融合訓練方法を提案する。
論文 参考訳(メタデータ) (2023-08-27T10:32:52Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。