論文の概要: GeNIE: A Generalizable Navigation System for In-the-Wild Environments
- arxiv url: http://arxiv.org/abs/2506.17960v1
- Date: Sun, 22 Jun 2025 09:36:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.67111
- Title: GeNIE: A Generalizable Navigation System for In-the-Wild Environments
- Title(参考訳): GeNIE: 無線環境のための汎用ナビゲーションシステム
- Authors: Jiaming Wang, Diwen Liu, Jizhuo Chen, Jiaxuan Da, Nuowen Qian, Tram Minh Man, Harold Soh,
- Abstract要約: 本稿では,グローバルデプロイメント用に設計されたロバストなナビゲーションフレームワークであるGeNIE(Generalizable Navigation System for In-the-Wild Environments)を紹介する。
GeNIEはSAM2上に構築された一般化可能なトラバーサビリティ予測モデルと新しい経路融合戦略を統合する。
我々はICRA 2025で地球ローバーチャレンジ(ERC)にGeNIEを配備し、3大陸にまたがる6カ国で評価を行った。
- 参考スコア(独自算出の注目度): 9.022848632405966
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reliable navigation in unstructured, real-world environments remains a significant challenge for embodied agents, especially when operating across diverse terrains, weather conditions, and sensor configurations. In this paper, we introduce GeNIE (Generalizable Navigation System for In-the-Wild Environments), a robust navigation framework designed for global deployment. GeNIE integrates a generalizable traversability prediction model built on SAM2 with a novel path fusion strategy that enhances planning stability in noisy and ambiguous settings. We deployed GeNIE in the Earth Rover Challenge (ERC) at ICRA 2025, where it was evaluated across six countries spanning three continents. GeNIE took first place and achieved 79% of the maximum possible score, outperforming the second-best team by 17%, and completed the entire competition without a single human intervention. These results set a new benchmark for robust, generalizable outdoor robot navigation. We will release the codebase, pretrained model weights, and newly curated datasets to support future research in real-world navigation.
- Abstract(参考訳): 非構造的で現実世界の環境における信頼性の高いナビゲーションは、特に多様な地形、気象条件、センサー構成を横断する操作を行う場合、実施エージェントにとって重要な課題である。
本稿では,グローバルデプロイメント用に設計されたロバストなナビゲーションフレームワークであるGeNIE(Generalizable Navigation System for In-the-Wild Environments)を紹介する。
GeNIEはSAM2上に構築された一般化可能なトラバーサビリティ予測モデルと、ノイズやあいまいな環境下での計画安定性を高める新しい経路融合戦略を統合する。
我々はICRA 2025で地球ローバーチャレンジ(ERC)にGeNIEを配備し、3大陸にまたがる6カ国で評価を行った。
GeNIEは最多得点の79%を獲得し、最多得点の17%を17%上回り、人間の介入なしに全試合を完走させた。
これらの結果は、堅牢で一般化可能な屋外ロボットナビゲーションのための新しいベンチマークを設定した。
コードベース、事前訓練されたモデルウェイト、そして、将来の現実世界のナビゲーション研究をサポートするために新しくキュレートされたデータセットをリリースします。
関連論文リスト
- TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments [0.6597195879147555]
TopoNavは、スパース・リワード設定における効率的な目標指向の探索とナビゲーションのための新しいフレームワークである。
TopoNavは環境のトポロジカルマップを動的に構築し、主要な場所と経路をキャプチャする。
本研究では,Clearpath Jackalロボットを用いて,シミュレーションと実世界のオフロード環境におけるTopoNavの評価を行った。
論文 参考訳(メタデータ) (2024-02-06T15:05:25Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。
我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。
我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文 参考訳(メタデータ) (2023-07-28T16:03:28Z) - CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-06-17T11:44:04Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。