論文の概要: VANDERER: Map-Free Exploration using Future-Aware and Visual-Curiosity-Guided Diffusion Policy
- arxiv url: http://arxiv.org/abs/2606.14879v1
- Date: Fri, 12 Jun 2026 18:33:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.359598
- Title: VANDERER: Map-Free Exploration using Future-Aware and Visual-Curiosity-Guided Diffusion Policy
- Title(参考訳): VANDERER: 未来認識とビジュアルキュリオシティ誘導拡散政策を用いた地図自由探索
- Authors: Venkata Naren Devarakonda, Raktim Gautam Goswami, Prashanth Krishnamurthy, Farshad Khorrami,
- Abstract要約: VANDERERは、Visual Curiosity Moduleを利用して事前訓練された拡散ポリシーをガイドする探索フレームワークである。
様々なシミュレートされた環境において評価され、VANDERは確立されたベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 12.450778241309365
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile agents require efficient exploration strategies to map unseen environments and autonomously plan tasks. Traditional methods rely on generating occupancy maps and optimizing the sequence in which unexplored regions are visited. However, in sensor-constrained settings, such as those limited to monocular cameras, generating accurate occupancy maps is challenging. To address this, we propose VANDERER, an exploration framework that leverages a Visual Curiosity Module (VCM) to guide pre-trained diffusion policies using only monocular image data. This curiosity module predicts the outcomes of proposed actions via a navigation world model and evaluates them through a curiosity cost. The cost then guides the diffusion process toward generating actions that maximize exploration. Evaluated across diverse simulated environments, VANDERER consistently outperforms established baselines, exploring an average of 13.4% more area than NoMaD. Our results reveal a direct correlation between visual and geometric curiosity in outdoor environments, demonstrating that VANDERER can effectively leverage this relationship for efficient exploration using sensor-constrained agents.
- Abstract(参考訳): モバイルエージェントは、見えない環境をマップし、自律的にタスクを計画するために効率的な探索戦略を必要とする。
伝統的な手法は、占有地図の作成と、探索されていない地域を訪れる順序を最適化することに依存している。
しかし、単眼カメラに限られているようなセンサーに制約のある環境では、正確な占有マップを生成することは困難である。
これを解決するために,単眼画像データのみを用いて事前学習した拡散ポリシーを導出するVisual Curiosity Module (VCM)を利用した探索フレームワークであるVANDERERを提案する。
この好奇心モジュールは、ナビゲーションワールドモデルを用いて提案された行動の結果を予測し、好奇心のコストで評価する。
コストは拡散過程を探索を最大化する行動へと導く。
様々なシミュレーション環境で評価され、VANDERERは確立された基準線を常に上回り、NoMaDよりも平均13.4%高い面積を探索した。
その結果, 屋外環境における視覚的好奇性と幾何学的好奇性との直接的相関が明らかとなり, VANDERERがこの関係を有効活用し, センサ拘束剤を用いた効率的な探索が可能であることが示唆された。
関連論文リスト
- APEX: Autonomous Policy Exploration for Self-Evolving LLM Agents [54.213455157510445]
自己進化型エージェントは、モデルウェイト更新を必要とせず、エピソード間でメモリとリフレクションを蓄積することによって学習する。
メモリが大きくなるにつれて、行動は慣れ親しんだハイリワードルーチンに集中し、より良い選択肢を発見する機会を減らす。
戦略マップを通じて明確な戦略空間を構築し維持する自律的政策展開(APEX)を提案する。
論文 参考訳(メタデータ) (2026-05-20T14:29:27Z) - Proprioceptive Safe Active Navigation and Exploration for Planetary Environments [2.2120851074630177]
Proprioceptive Safe Active Navigation and Exploration (PSANE)は、未知の変形可能な環境における安全なナビゲーションと探索のためのフレームワークである。
PSANEはガウスプロセスレグレッションを通じてトラバーサビリティモデルを学び、安全な領域を推定し、認定する。
リアルタイムナビゲーションのためのリアクティブコントローラとこれらの見積を統合する。
論文 参考訳(メタデータ) (2026-03-09T20:17:50Z) - FrontierNet: Learning Visual Cues to Explore [54.8265603996238]
この研究は、3Dマップからゴールポーズを抽出する制限に対処するため、効率的な自律探索に2Dビジュアルキューを活用することを目的としている。
本稿では、FrontierNetをコアコンポーネントとする、視覚のみのフロンティアベースの探索システムを提案する。
提案手法は,既存の3次元目標抽出手法に代わるもので,早期探索効率の15%向上を実現している。
論文 参考訳(メタデータ) (2025-01-08T16:25:32Z) - Deep Reinforcement Learning for Adaptive Exploration of Unknown
Environments [6.90777229452271]
私達はUAVのための1つのステップで調査および搾取間のトレードオフに適応的な調査のアプローチを開発します。
提案手法では, 環境マップを小型でトラクタブルな地図に分解するために, マップセグメンテーション手法を用いる。
その結果,本提案手法は,ランダムに生成された環境をナビゲートし,ベースラインと比較してAoIを短時間でカバーできることが示された。
論文 参考訳(メタデータ) (2021-05-04T16:29:44Z) - Autonomous UAV Exploration of Dynamic Environments via Incremental
Sampling and Probabilistic Roadmap [0.3867363075280543]
インクリメンタルサンプリングと確率的ロードマップ(PRM)を用いた未知環境探索のための新しい動的探索プランナ(DEP)を提案する。
本手法は, 動的環境を安全に探索し, 探索時間, 経路長, 計算時間でベンチマークプランナーより優れている。
論文 参考訳(メタデータ) (2020-10-14T22:52:37Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z) - Counterfactual Vision-and-Language Navigation via Adversarial Path Sampling [65.99956848461915]
VLN(Vision-and-Language Navigation)は、エージェントが目標を達成するために3D環境を移動する方法を決定するタスクである。
VLNタスクの問題点の1つは、対話型環境において、人間に注釈を付けた指示で十分なナビゲーションパスを収集することは困難であるため、データの不足である。
本稿では,低品質な拡張データではなく,効果的な条件を考慮可能な,対向駆動の反実的推論モデルを提案する。
論文 参考訳(メタデータ) (2019-11-17T18:02:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。