論文の概要: VLM-RRT: Vision Language Model Guided RRT Search for Autonomous UAV Navigation
- arxiv url: http://arxiv.org/abs/2505.23267v1
- Date: Thu, 29 May 2025 09:15:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.780485
- Title: VLM-RRT: Vision Language Model Guided RRT Search for Autonomous UAV Navigation
- Title(参考訳): VLM-RRT:自律型UAVナビゲーションのための視覚言語モデルガイドRT検索
- Authors: Jianlin Ye, Savvas Papaioannou, Panayiotis Kolios,
- Abstract要約: 本稿では,視覚言語モデル(VLM)のパターン認識機能とRRT(Rapidly-Exploring Random Trees)の経路計画強度を統合するハイブリッドアプローチであるビジョン言語モデルRT(VLM-RRT)を提案する。
提案手法は, サンプリング効率と経路品質を著しく向上させるため, 実現可能な経路を含む可能性が高い領域に対してサンプリングをバイアスする。
- 参考スコア(独自算出の注目度): 4.022717732460524
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Path planning is a fundamental capability of autonomous Unmanned Aerial Vehicles (UAVs), enabling them to efficiently navigate toward a target region or explore complex environments while avoiding obstacles. Traditional pathplanning methods, such as Rapidly-exploring Random Trees (RRT), have proven effective but often encounter significant challenges. These include high search space complexity, suboptimal path quality, and slow convergence, issues that are particularly problematic in high-stakes applications like disaster response, where rapid and efficient planning is critical. To address these limitations and enhance path-planning efficiency, we propose Vision Language Model RRT (VLM-RRT), a hybrid approach that integrates the pattern recognition capabilities of Vision Language Models (VLMs) with the path-planning strengths of RRT. By leveraging VLMs to provide initial directional guidance based on environmental snapshots, our method biases sampling toward regions more likely to contain feasible paths, significantly improving sampling efficiency and path quality. Extensive quantitative and qualitative experiments with various state-of-the-art VLMs demonstrate the effectiveness of this proposed approach.
- Abstract(参考訳): 経路計画は無人航空機(UAV)の基本的な能力であり、障害物を避けながら標的地域への効率的な移動や複雑な環境の探索を可能にする。
RRT(Rapidly-Exploring Random Trees)のような従来のパスプランニング手法は、有効性は証明されているが、しばしば重大な課題に直面している。
これらには、高速で効率的な計画が不可欠である災害対応のような、高度なアプリケーションにおいて特に問題となる、検索空間の複雑さ、最適下限のパス品質、収束の遅い問題が含まれる。
これらの制約に対処し、経路計画効率を向上させるために、視覚言語モデル(VLM)のパターン認識機能とRTの経路計画強度を統合するハイブリッドアプローチであるビジョン言語モデルRT(VLM-RRT)を提案する。
環境スナップショットに基づいて,VLMを初期方向性誘導に活用することにより,本手法はサンプリング効率と経路品質を大幅に向上させるとともに,実現可能な経路を含む可能性のある領域に対するサンプリング偏差を増大させる。
様々な最先端VLMを用いた大規模定量および定性的実験により,提案手法の有効性が示された。
関連論文リスト
- DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving [15.776506097490252]
VLM(Vision-Language Model)による新しいハイブリッドスパース距離拡散政策を提案する。
提案手法は,現実的,反応的な合成シナリオを含む自律的グランドチャレンジ2025において,優れた性能を示す。
論文 参考訳(メタデータ) (2025-05-26T00:49:35Z) - Application of YOLOv8 in monocular downward multiple Car Target detection [0.0]
本稿では,YOLOv8に基づく自律目標検出ネットワークの改良について述べる。
提案手法は,マルチスケール,小型,遠隔オブジェクトの高精度かつ高精度な検出を実現する。
実験結果から,大小の物体を65%の精度で効果的に検出できることが示唆された。
論文 参考訳(メタデータ) (2025-05-15T06:58:45Z) - Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models [62.12822290276912]
Auto-RTは、複雑な攻撃戦略を探索し最適化する強化学習フレームワークである。
探索効率を大幅に改善し、攻撃戦略を自動的に最適化することにより、Auto-RTはボーダの脆弱性範囲を検出し、検出速度が速く、既存の方法と比較して16.63%高い成功率を達成する。
論文 参考訳(メタデータ) (2025-01-03T14:30:14Z) - SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。
SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。
また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - Vertex-based Networks to Accelerate Path Planning Algorithms [3.684936338492373]
本稿では,RT* のサンプリングプロセスを強化するため,頂点に基づくネットワークの利用を提案し,より効率的な経路計画手法を提案する。
我々は、関連するデータ不均衡問題に対処するために焦点損失を採用し、異なるマスキング構成を探索し、システム性能の実用的なトレードオフを決定する。
論文 参考訳(メタデータ) (2023-07-13T20:56:46Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Trajectory Planning for Autonomous Vehicles Using Hierarchical
Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。
RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。
軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文 参考訳(メタデータ) (2020-11-09T20:49:54Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。