論文の概要: AirDreamer: Generalist Drone Navigation with World Models
- arxiv url: http://arxiv.org/abs/2606.03252v1
- Date: Tue, 02 Jun 2026 07:15:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.830256
- Title: AirDreamer: Generalist Drone Navigation with World Models
- Title(参考訳): AirDreamer:世界モデル搭載の汎用ドローンナビゲーション
- Authors: Zian Liu, Andong Yang, Chunkai Yang, Ruidong An, Chao Gao, Guyue Zhou,
- Abstract要約: 見えない、散らばった環境でドローンをナビゲートするには、見えないシーンレイアウトと環境構造を理解するための信頼性の高い一般化が必要である。
我々は、世界モデルに基づく環境理解の上に、強化学習に基づくポリシーでナビゲートするナビゲーションフレームワークを設計する。
シミュレーションや実際のドローンでは、複雑な、見えない環境をナビゲートし、ローカルなオプティマを逃れるための創発的な能力を示す。
- 参考スコア(独自算出の注目度): 33.07482385485505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating a drone in unseen and cluttered environments requires reliable generalization to unseen scene layouts and understanding of environmental structure relative to the robot's capabilities. Previous methods, which assume the same environment configuration, often rely heavily on human-designed perception pipelines and predefined rules to guide the robot toward the target. This process is environment-dependent and generalizes poorly across environments. Inspired by animal navigation behavior, we design a navigation framework that navigates with a reinforcement-learning-based policy on top of a world-model-based environment understanding to overcome these issues. In addition, a sparse reward function without hand-crafted shaping terms is designed to avoid local minima traps and encourage yaw control behaviors. In simulation and on real drones, our method exhibits emergent capabilities for navigating complex, unseen environments and escaping local optima where other methods fail. In challenging maps, it achieves a 5.3% higher navigation success rate than best baseline. Furthermore, the proposed framework achieves effective sim-to-real transfer without any tuning during deployment. The code will be publicly available.
- Abstract(参考訳): 見えない、散らかった環境でドローンをナビゲートするには、見えないシーンレイアウトとロボットの能力に対する環境構造を理解するための信頼性の高い一般化が必要である。
以前と同じ環境構成を仮定する手法は、ロボットを目標に向かって誘導するための人間設計の知覚パイプラインや事前定義されたルールに大きく依存することが多い。
このプロセスは環境に依存しており、環境全体にわたってあまり一般化されていない。
動物ナビゲーションの行動にインスパイアされた私たちは,これらの問題を克服するために,世界モデルに基づく環境理解の上に,強化学習に基づくポリシーでナビゲートするナビゲーションフレームワークを設計する。
また、手作りの成形用語を含まないスパース報酬関数は、局所的なミニマトラップを回避し、ヨー制御行動を奨励するように設計されている。
シミュレーションや実際のドローンでは、複雑な、見えない環境をナビゲートし、他の方法が失敗する場所を脱出する緊急能力を示す。
挑戦的なマップでは、最良のベースラインよりも5.3%高いナビゲーション成功率を達成する。
さらに,本提案フレームワークは,デプロイ中のチューニングを伴わずに,効率的なsim-to-real転送を実現する。
コードは公開されます。
関連論文リスト
- HiPAN: Hierarchical Posture-Adaptive Navigation for Quadruped Robots in Unstructured 3D Environments [13.984002802852638]
非構造型3D環境における四足歩行ロボットの移動は、目標指向の動作、局所的なミニマから脱出するための効果的な探索、横幅の狭い高さ制限された空間への姿勢適応など、大きな課題を生んでいる。
本報告では,階層型姿勢適応ナビゲーション(HiPAN, Hierarchical Posture-Adaptive Navigation)を提案する。
HiPANは、古典的なリアクティブプランナーやエンドツーエンドのベースラインよりも、明度の高いナビゲーション成功率とパス効率を実現しています。
論文 参考訳(メタデータ) (2026-04-29T10:08:48Z) - OpenFrontier: General Navigation with Visual-Language Grounded Frontiers [54.661157616245966]
オープンワールドナビゲーションでは、複雑な日常環境においてロボットが意思決定を行う必要がある。
近年の視覚-言語ナビゲーション(VLN)と視覚-言語-アクション(VLA)モデルは、自然言語で条件付けられたエンドツーエンドのポリシーを実現する。
多様な視覚をシームレスに統合するトレーニングフリーナビゲーションフレームワークであるOpenFrontierを提案する。
論文 参考訳(メタデータ) (2026-03-05T17:02:22Z) - RAVEN: Resilient Aerial Navigation via Open-Set Semantic Memory and Behavior Adaptation [20.730528223747967]
RAVENは、非構造化屋外環境での空中セマンティックナビゲーションのための3Dメモリベースの行動ツリーフレームワークである。
空間的に一貫したセマンティックなボクセル線マップを永続記憶として使用し、長期計画を可能にし、純粋に反応性のある振る舞いを避ける。
RAVENは、シミュレーションのベースラインを85.25%上回り、屋外フィールドテストにおける空中ロボットへの展開を通じて実世界の適用性を実証している。
論文 参考訳(メタデータ) (2025-09-28T01:43:25Z) - TANGO: Traversability-Aware Navigation with Local Metric Control for Topological Goals [10.69725316052444]
ゼロショット・ロングホライゾン・ロボットナビゲーションを可能にする新しいRGBのみのオブジェクトレベルのトポロジカルナビゲーションパイプラインを提案する。
提案手法は,グローバルなトポロジカルパス計画と局所的軌跡制御を統合し,障害物を避けつつ,ロボットがオブジェクトレベルのサブゴールに向かって移動できるようにする。
シミュレーション環境と実世界の両方のテストにおいて,本手法の有効性を実証し,その堅牢性とデプロイ性を強調した。
論文 参考訳(メタデータ) (2025-09-10T15:43:32Z) - TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation [5.484041860401147]
TOP-Navは、包括的パスプランナーとTerran認識、Obstacle回避、クローズループプロプライオセプションを統合した、新しい脚付きナビゲーションフレームワークである。
そこで,TOP-Navは,従来の知識の分布を超えた地形や乱れをロボットが扱えるように,オープンワールドナビゲーションを実現する。
論文 参考訳(メタデータ) (2024-04-23T17:42:45Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-06-17T11:44:04Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - ViNG: Learning Open-World Navigation with Visual Goals [82.84193221280216]
視覚的目標達成のための学習に基づくナビゲーションシステムを提案する。
提案手法は,我々がvingと呼ぶシステムが,目標条件強化学習のための提案手法を上回っていることを示す。
我々は、ラストマイル配送や倉庫検査など、現実の多くのアプリケーションでViNGを実演する。
論文 参考訳(メタデータ) (2020-12-17T18:22:32Z) - Robot Navigation in Constrained Pedestrian Environments using
Reinforcement Learning [32.454250811667904]
歩行者のまわりをスムーズに移動することは、人間環境に展開する移動ロボットに必要な能力である。
移動歩行者の存在に動的に適応できる政策を学習するための強化学習に基づくアプローチを提案する。
2つの実環境の3D再構成に学習方針の移転を示す。
論文 参考訳(メタデータ) (2020-10-16T19:40:08Z) - BADGR: An Autonomous Self-Supervised Learning-Based Navigation System [158.6392333480079]
BadGRは、エンドツーエンドの学習ベースのモバイルロボットナビゲーションシステムである。
実際の環境で収集された、自己監督型のオフポリシーデータでトレーニングすることができる。
BadGRは、幾何学的に邪魔な障害物を伴って、現実世界の都市やオフロード環境をナビゲートすることができる。
論文 参考訳(メタデータ) (2020-02-13T18:40:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。