論文の概要: Autonomous Frontier-Based Exploration with VLM Guidance
- arxiv url: http://arxiv.org/abs/2605.23165v1
- Date: Fri, 22 May 2026 02:33:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.164969
- Title: Autonomous Frontier-Based Exploration with VLM Guidance
- Title(参考訳): VLM誘導による自律的フロンティアベース探査
- Authors: Aarush Aitha, Avideh Zakhor,
- Abstract要約: 本稿では,VLM(Vision-Language Models)が高レベルの戦略的意思決定を行う,新たな探索パイプラインを提案する。
決定ポイントでは、ロボットは現在の地図と潜在的な経路、またはフロンティアの視覚イメージでマルチモーダルプロンプトを生成する。
VLMはこのプロンプトを分析して最も有望なフロンティアを選択し、単純な幾何学を文脈空間推論に置き換える。
- 参考スコア(独自算出の注目度): 3.007949058551534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous robotic exploration of unknown and hazardous environments, a long-standing challenge, can be significantly improved by leveraging the advanced reasoning of Vision-Language Models (VLMs). We introduce a novel exploration pipeline where a VLM performs high-level strategic decision-making, guiding a conventional low-level robotics control stack. At decision points, the robot generates a multimodal prompt with its current map and visual imagery of potential paths, or frontiers. The VLM analyzes this prompt to select the most promising frontier, replacing simple geometric heuristics with contextual spatial reasoning. This approach, validated in simulation across six indoor environments, improves map coverage by up to 24\% over existing methods. Our pipeline is lightweight, training-free, and easily transferable to any robot with standard sensors and an internet connection.
- Abstract(参考訳): VLM(Vision-Language Models)の先進的推論を活用することで、長期にわたる課題である、未知で危険な環境の自律的なロボット探査を大幅に改善することができる。
本稿では,VLMが従来の低レベルのロボット制御スタックを導くことによって,高レベルの戦略的意思決定を行う新たな探索パイプラインを提案する。
決定ポイントでは、ロボットは現在の地図と潜在的な経路、またはフロンティアの視覚イメージでマルチモーダルプロンプトを生成する。
VLMはこのプロンプトを分析して最も有望なフロンティアを選択し、単純な幾何学的ヒューリスティックを文脈空間的推論に置き換える。
このアプローチは6つの屋内環境のシミュレーションで検証され、既存の手法よりも最大24倍のマップカバレッジが向上する。
私たちのパイプラインは軽量で、トレーニング不要で、標準的なセンサーとインターネット接続を備えたあらゆるロボットに簡単に転送できます。
関連論文リスト
- The Unified Autonomy Stack: Toward a Blueprint for Generalizable Robot Autonomy [13.105188128582567]
我々は,空と地上のロボット形態を横断するレジリエンスな自律を可能にするシステムレベルのソリューションであるUnified Autonomy Stackを紹介し,オープンソース化する。
アーキテクチャは、マルチモーダル認識、マルチビヘイビア計画、マルチレイヤセーフナビゲーションの3つのモジュールを中心にしている。
このスタックは、地上(ロータークラフト)ロボットと地上(レッグ)ロボットの両方でフィールドテストされ、検証されている。
論文 参考訳(メタデータ) (2026-05-12T20:39:35Z) - AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios [64.51320327698231]
UAVシナリオにおける最初の大規模RMOTベンチマークであるAerialMindを紹介する。
我々は、革新的な半自動協調型エージェントベースラベリングアシスタントフレームワークを開発した。
また,視覚言語表現学習を協調的に強化する新しい手法であるHawkEyeTrackを提案する。
論文 参考訳(メタデータ) (2025-11-26T04:44:27Z) - Think, Remember, Navigate: Zero-Shot Object-Goal Navigation with VLM-Powered Reasoning [8.316876835702525]
ビジョンランゲージモデル(VLM)は、ロボットナビゲーションを変換するために設定されている。
我々のフレームワークは、その文脈理解を活用してフロンティアベースの探索エージェントを誘導する高レベルのプランニングをVLMにアウトソースする。
HM3D、Gibson、MP3Dのような挑戦的なベンチマークでテストすると、この手法は例外的に直接的かつ論理的な軌道を生成する。
論文 参考訳(メタデータ) (2025-11-12T03:38:50Z) - Astra: Toward General-Purpose Mobile Robots via Hierarchical Multimodal Learning [40.770287109084826]
Astraは、モバイルロボットナビゲーションのための総合的なデュアルモデルアーキテクチャである。
Astra-Globalは視覚と言語入力を処理し、自己と目標のローカライゼーションを実行する。
Astra-Localは、ローカルパス計画とオドメトリー推定を処理する。
論文 参考訳(メタデータ) (2025-06-06T16:08:47Z) - Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation [90.00687889213991]
複雑な長距離ロボット操作問題を解決するには、高度な高レベルの計画能力が必要である。
インターネット上で事前訓練された視覚言語モデル(VLM)は、原則としてそのような問題に対処するためのフレームワークを提供する。
本稿では,多段階操作タスクにおけるVLMの物理推論能力を高める新しいテストタイムフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-23T20:42:15Z) - FrontierNet: Learning Visual Cues to Explore [54.8265603996238]
この研究は、3Dマップからゴールポーズを抽出する制限に対処するため、効率的な自律探索に2Dビジュアルキューを活用することを目的としている。
本稿では、FrontierNetをコアコンポーネントとする、視覚のみのフロンティアベースの探索システムを提案する。
提案手法は,既存の3次元目標抽出手法に代わるもので,早期探索効率の15%向上を実現している。
論文 参考訳(メタデータ) (2025-01-08T16:25:32Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - Sim-to-Real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning [22.077058792635313]
被覆経路計画は、制限された地域の自由空間全体をカバーする経路を見つける問題である。
本稿では,この課題に対する連続空間強化学習の有効性について検討する。
提案手法は従来のRLに基づく手法と高度に専門化された手法の両方の性能を上回ることを示す。
論文 参考訳(メタデータ) (2024-06-07T13:24:19Z) - Reinforcement Learning with Frontier-Based Exploration via Autonomous
Environment [0.0]
この研究は、ExploreORBとして知られる既存のVisual-Graph SLAMと強化学習を組み合わせたものである。
提案アルゴリズムは、フロンティアの探索プロセスを最適化し、より正確な地図を作成することにより、ExploreORBの効率と精度を向上させることを目的としている。
論文 参考訳(メタデータ) (2023-07-14T12:19:46Z) - Incremental 3D Scene Completion for Safe and Efficient Exploration
Mapping and Planning [60.599223456298915]
本研究では,情報,安全,解釈可能な地図作成と計画に3次元シーン補完を活用することによって,深層学習を探索に統合する新しい手法を提案する。
本手法は,地図の精度を最小限に抑えることで,ベースラインに比べて環境のカバレッジを73%高速化できることを示す。
最終地図にシーン完了が含まれていなくても、ロボットがより情報的な経路を選択するように誘導し、ロボットのセンサーでシーンの測定を35%高速化できることが示される。
論文 参考訳(メタデータ) (2022-08-17T14:19:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。