論文の概要: PEACE: A Planner-Executor Agent with Constraint Enforcement for UAVs
- arxiv url: http://arxiv.org/abs/2606.00104v1
- Date: Tue, 26 May 2026 10:03:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:27.955523
- Title: PEACE: A Planner-Executor Agent with Constraint Enforcement for UAVs
- Title(参考訳): PEACE:UAVの制約付きプランナー・エクササイズエージェント
- Authors: Erdem Uysal, Timo Kehrer, Sebastiano Panichella,
- Abstract要約: 低レベルの制御から高レベルのミッション計画を切り離すPX4ベースのドローンのプランナー・エグゼクタエージェントを提案する。
大きな言語モデルはシングルパスタスクプランニングを実行し、実行は構造化されたROS 2ツールコールインターフェースによって処理される。
その結果,LLM制御に比べて説明可能性,制約強制性,LLM呼び出しの短縮性が向上した。
- 参考スコア(独自算出の注目度): 4.022353603224729
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Foundation models are increasingly used to drive autonomous systems, yet existing approaches either keep the model in a tight control loop, raising latency and hallucination risk, or compile natural language into opaque end-to-end policies that are hard to explain, constraint and require domain-specific datasets and fine-tuning. We propose a planner-executor agent for PX4-based drones that decouples high-level mission planning from low-level control. A large language model performs single-pass task planning, while execution is handled through a structured ROS 2 tool-calling interface bridged to MAVLink. The system constructs a world model by combining modular 2D detectors (e.g., YOLO or vision-language models) with a pinhole depth projection module for 3D object localization. A constraint enforcement layer enforces altitude limits and horizontal geofencing, and bounded replanning enables recovery from execution-time action failures. We position our approach within three common design patterns for foundation-model-based robotics systems and demonstrate its feasibility in PX4 software-in-the-loop simulations in Gazebo. Results highlight improved explainability, constraint enforcement, and reduced LLM calls compared to tightly coupled LLM control. The code, dataset, videos, and other material can be found at the following link: https://github.com/erdemuysalx/PEACE
- Abstract(参考訳): ファンデーションモデルは、自律システムの駆動にますます使用されているが、既存のアプローチでは、モデルを厳格な制御ループに保ち、レイテンシと幻覚リスクを上昇させるか、あるいは自然言語を、説明し、制約し、ドメイン固有のデータセットと微調整を必要とする不透明なエンドツーエンドのポリシーにコンパイルする。
低レベルの制御から高レベルのミッション計画を切り離すPX4ベースのドローンのプランナー・エグゼクタエージェントを提案する。
大きな言語モデルはシングルパスタスク計画を実行し、一方、実行はMAVLinkにブリッジされた構造化ROS 2ツールコールインターフェースによって処理される。
このシステムは、モジュラー2D検出器(例えば、YOLOや視覚言語モデル)とピンホール深度投影モジュールを組み合わせることで、3Dオブジェクトのローカライゼーションを実現することで世界モデルを構築する。
制約執行層は高度制限と水平ジオフェンシングを強制し、有界リプランニングは実行時の動作障害からの回復を可能にする。
提案手法は,基礎モデルに基づくロボットシステムのための3つの共通設計パターンに位置づけ,ガゼボのPX4ソフトウェア・イン・ザ・ループシミュレーションにおける実現可能性を示す。
その結果,LLM制御に比べて説明可能性,制約強制性,LLM呼び出しの短縮性が向上した。
コード、データセット、ビデオ、その他の資料は以下のリンクで見ることができる。
関連論文リスト
- MAPLE: Latent Multi-Agent Play for End-to-End Autonomous Driving [62.43744546817599]
視覚言語-アクション(VLA)モデルは、エンドツーエンドのモーションプランナーとして有効であるが、クローズドループ設定で評価すると不安定である。
本稿では, VLAモデルの潜在空間における動的駆動シナリオの, リアクティブでマルチエージェントなロールアウトのための新しいフレームワークMAPLEを提案する。
MAPLEはBench2Driveで最先端の駆動性能を実現し、堅牢なE2E自動運転システムのためのスケーラブルでクローズループなマルチエージェントプレイを実演する。
論文 参考訳(メタデータ) (2026-05-13T23:35:14Z) - Bridging Large-Model Reasoning and Real-Time Control via Agentic Fast-Slow Planning [42.15812524999639]
Agentic Fast-Slow Planning(エージェント・ファスト・スロー・プランニング)は、知覚、推論、計画、そして自然の時間スケールをまたいだ制御を分離する階層的なフレームワークである。
エージェント高速スロープランニングは摂動下での堅牢性を向上し、純粋なMPCおよびA*誘導MPCベースラインと比較して、横方向偏差を最大45%減らし、完了時間を12%以上短縮することを示した。
論文 参考訳(メタデータ) (2026-04-02T06:34:29Z) - Fly0: Decoupling Semantic Grounding from Geometric Planning for Zero-Shot Aerial Navigation [14.466092698477858]
現在のVisual-Language Navigation (VLN) 手法はセマンティック理解と制御精度のトレードオフに直面している。
幾何学的計画から意味論的推論を分離するフレームワークFly0を提案する。
Fly0は計算オーバーヘッドを減らし、システムの安定性を向上させる。
論文 参考訳(メタデータ) (2026-02-02T09:06:50Z) - Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。
実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-12T12:38:20Z) - SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation [22.71952631383849]
SmallPlanは、教師モデルとしてLarge Language Modelsを活用して、ハイレベルパス計画タスクのために軽量なSLM(Small Language Models)をトレーニングする新しいフレームワークである。
LLM誘導微調整(SFT)と強化学習(RL)を併用したシミュレーションによるインターリーブ方式のSLM訓練
本研究は, GPT-4oのような大型モデルと連続経路計画において, 幻覚や過剰適合に悩まされることなく, 微調整SLMが競合することを示す。
論文 参考訳(メタデータ) (2025-05-01T19:44:36Z) - Foundation Models to the Rescue: Deadlock Resolution in Connected Multi-Robot Systems [11.012092202226855]
接続型マルチエージェントロボットシステム(MRS)は、障害物環境下でデッドロックする傾向がある。
本稿では,大規模言語モデル (LLM) やテキスト・アンド・イメージモデル (VLM) をデッドロック解像度の高レベルプランナとして用いる可能性について検討する。
本稿では,基礎モデルに基づくハイレベルプランナが,MSSのリーダーをMSSのリーダーに割り当てることでデッドロックの解決を支援する階層的制御フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T16:03:26Z) - DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文 参考訳(メタデータ) (2023-12-14T18:59:05Z) - Plan, Eliminate, and Track -- Language Models are Good Teachers for
Embodied Agents [99.17668730578586]
事前訓練された大言語モデル(LLM)は、世界に関する手続き的な知識をキャプチャする。
Plan, Eliminate, and Track (PET)フレームワークはタスク記述をハイレベルなサブタスクのリストに変換する。
PETフレームワークは、人間の目標仕様への一般化のために、SOTAよりも15%改善されている。
論文 参考訳(メタデータ) (2023-05-03T20:11:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。