論文の概要: FM-Planner: Foundation Model Guided Path Planning for Autonomous Drone Navigation
- arxiv url: http://arxiv.org/abs/2505.20783v1
- Date: Tue, 27 May 2025 06:41:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.454089
- Title: FM-Planner: Foundation Model Guided Path Planning for Autonomous Drone Navigation
- Title(参考訳): FM-Planner:自律型ドローンナビゲーションのためのパスプランニングの基礎モデル
- Authors: Jiaping Xiao, Cheng Wen Tsao, Yuhang Zhang, Mir Feroskhan,
- Abstract要約: パスプランニングは自律ドローンの運用において重要な要素であり、複雑な環境を通した安全かつ効率的なナビゲーションを可能にする。
基礎モデル,特に大規模言語モデル (LLM) や視覚言語モデル (VLM) の最近の進歩は,ロボット工学における知覚と知的な意思決定を向上する新たな機会を生み出している。
本稿では,基礎モデル誘導経路プランナー (FM-Planner) を提案する。
- 参考スコア(独自算出の注目度): 1.280979348722635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Path planning is a critical component in autonomous drone operations, enabling safe and efficient navigation through complex environments. Recent advances in foundation models, particularly large language models (LLMs) and vision-language models (VLMs), have opened new opportunities for enhanced perception and intelligent decision-making in robotics. However, their practical applicability and effectiveness in global path planning remain relatively unexplored. This paper proposes foundation model-guided path planners (FM-Planner) and presents a comprehensive benchmarking study and practical validation for drone path planning. Specifically, we first systematically evaluate eight representative LLM and VLM approaches using standardized simulation scenarios. To enable effective real-time navigation, we then design an integrated LLM-Vision planner that combines semantic reasoning with visual perception. Furthermore, we deploy and validate the proposed path planner through real-world experiments under multiple configurations. Our findings provide valuable insights into the strengths, limitations, and feasibility of deploying foundation models in real-world drone applications and providing practical implementations in autonomous flight. Project site: https://github.com/NTU-ICG/FM-Planner.
- Abstract(参考訳): パスプランニングは自律ドローンの運用において重要な要素であり、複雑な環境を通した安全かつ効率的なナビゲーションを可能にする。
基礎モデル,特に大規模言語モデル (LLM) と視覚言語モデル (VLM) の最近の進歩は,ロボット工学における知覚と知的な意思決定を向上する新たな機会を開いた。
しかし、グローバルパス計画における実践的適用性と有効性は、いまだに未解明のままである。
本稿では,基礎モデル誘導経路プランナ (FM-Planner) を提案する。
具体的には、まず、標準化されたシミュレーションシナリオを用いて、8つの代表的なLCMおよびVLMアプローチを体系的に評価する。
有効リアルタイムナビゲーションを実現するために,意味的推論と視覚知覚を組み合わせたLLM-Vision Plannerを設計する。
さらに,提案したパスプランナを実環境実験により複数構成で展開し,検証する。
我々の研究は、現実のドローンアプリケーションに基礎モデルを配置し、自律飛行に実用的な実装を提供することの強み、限界、実現可能性に関する貴重な洞察を提供する。
プロジェクトサイト:https://github.com/NTU-ICG/FM-Planner
関連論文リスト
- Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。
実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-12T12:38:20Z) - SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation [20.743117921048537]
SmallPlanは、教師モデルとしてLarge Language Modelsを活用して、ハイレベルパス計画タスクのために軽量なSLM(Small Language Models)をトレーニングする新しいフレームワークである。
SLMは、シミュレーション駆動のインターリーブ方式で、LLM指導による微調整と強化学習によって訓練される。
SmallPlanはリソース効率が良く、エッジデバイス展開や実用的な自律ロボット工学の進歩に適している。
論文 参考訳(メタデータ) (2025-05-01T19:44:36Z) - Dynamic Path Navigation for Motion Agents with LLM Reasoning [69.5875073447454]
大規模言語モデル(LLM)は、強力な一般化可能な推論と計画能力を示している。
本研究では,LLMのゼロショットナビゲーションと経路生成機能について,データセットの構築と評価プロトコルの提案により検討する。
このようなタスクが適切に構成されている場合、現代のLCMは、目標に到達するために生成された動きでナビゲーションを自律的に精錬しながら障害を回避するためのかなりの計画能力を示す。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.84996994779443]
本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。
我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。
挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2024-07-08T12:52:46Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Learning Forward Dynamics Model and Informed Trajectory Sampler for Safe
Quadruped Navigation [1.2783783498844021]
典型的なSOTAシステムは、マッパー、グローバルプランナー、ローカルプランナー、コマンドトラッキングコントローラの4つの主要モジュールで構成されている。
我々は,グローバルプランナから粗い計画経路を追跡するためのベロシティプランを生成するために,ロバストで安全なローカルプランナを構築している。
この枠組みを用いることで、四足歩行ロボットは衝突なしに様々な複雑な環境を自律的に移動でき、ベースライン法と比較してスムーズなコマンドプランを生成することができる。
論文 参考訳(メタデータ) (2022-04-19T04:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。