論文の概要: GeNIE: A Generalizable Navigation System for In-the-Wild Environments
- arxiv url: http://arxiv.org/abs/2506.17960v1
- Date: Sun, 22 Jun 2025 09:36:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.67111
- Title: GeNIE: A Generalizable Navigation System for In-the-Wild Environments
- Title(参考訳): GeNIE: 無線環境のための汎用ナビゲーションシステム
- Authors: Jiaming Wang, Diwen Liu, Jizhuo Chen, Jiaxuan Da, Nuowen Qian, Tram Minh Man, Harold Soh,
- Abstract要約: 本稿では,グローバルデプロイメント用に設計されたロバストなナビゲーションフレームワークであるGeNIE(Generalizable Navigation System for In-the-Wild Environments)を紹介する。
GeNIEはSAM2上に構築された一般化可能なトラバーサビリティ予測モデルと新しい経路融合戦略を統合する。
我々はICRA 2025で地球ローバーチャレンジ(ERC)にGeNIEを配備し、3大陸にまたがる6カ国で評価を行った。
- 参考スコア(独自算出の注目度): 9.022848632405966
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reliable navigation in unstructured, real-world environments remains a significant challenge for embodied agents, especially when operating across diverse terrains, weather conditions, and sensor configurations. In this paper, we introduce GeNIE (Generalizable Navigation System for In-the-Wild Environments), a robust navigation framework designed for global deployment. GeNIE integrates a generalizable traversability prediction model built on SAM2 with a novel path fusion strategy that enhances planning stability in noisy and ambiguous settings. We deployed GeNIE in the Earth Rover Challenge (ERC) at ICRA 2025, where it was evaluated across six countries spanning three continents. GeNIE took first place and achieved 79% of the maximum possible score, outperforming the second-best team by 17%, and completed the entire competition without a single human intervention. These results set a new benchmark for robust, generalizable outdoor robot navigation. We will release the codebase, pretrained model weights, and newly curated datasets to support future research in real-world navigation.
- Abstract(参考訳): 非構造的で現実世界の環境における信頼性の高いナビゲーションは、特に多様な地形、気象条件、センサー構成を横断する操作を行う場合、実施エージェントにとって重要な課題である。
本稿では,グローバルデプロイメント用に設計されたロバストなナビゲーションフレームワークであるGeNIE(Generalizable Navigation System for In-the-Wild Environments)を紹介する。
GeNIEはSAM2上に構築された一般化可能なトラバーサビリティ予測モデルと、ノイズやあいまいな環境下での計画安定性を高める新しい経路融合戦略を統合する。
我々はICRA 2025で地球ローバーチャレンジ(ERC)にGeNIEを配備し、3大陸にまたがる6カ国で評価を行った。
GeNIEは最多得点の79%を獲得し、最多得点の17%を17%上回り、人間の介入なしに全試合を完走させた。
これらの結果は、堅牢で一般化可能な屋外ロボットナビゲーションのための新しいベンチマークを設定した。
コードベース、事前訓練されたモデルウェイト、そして、将来の現実世界のナビゲーション研究をサポートするために新しくキュレートされたデータセットをリリースします。
関連論文リスト
- Global Commander and Local Operative: A Dual-Agent Framework for Scene Navigation [96.88162755522342]
視覚と言語 シーンナビゲーションは、人間のAIを具現化する基本的な能力である。
DACoは,グローバルな議論を現地の基盤から切り離す,計画的な非結合型アーキテクチャである。
グローバルな推論を局所的な行動から遠ざけることで、DACoは認知的過負荷を軽減し、長期的安定性を向上させる。
論文 参考訳(メタデータ) (2026-02-21T19:19:55Z) - STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization [73.98141357780032]
VLN-CEタスクでは、エージェントはシーン固有のトレーニングなしで自然言語命令を使用して3D環境をナビゲートする必要がある。
既存の方法は、構造化された意思決定の欠如と、以前の行動からのフィードバックの不十分な統合のために、堅牢なナビゲーションを達成できないことが多い。
STRIDERは,空間配置先と動的タスクフィードバックを統合し,エージェントの決定空間を体系的に最適化する新しいフレームワークである。
提案手法では,1)空間構造を介して行動空間を制約する構造的ウェイポイントジェネレータ,2)タスクの進行に応じて行動を調整するタスク調整レギュレータ,そしてナビゲーション全体を通して意味的アライメントを確保する。
論文 参考訳(メタデータ) (2025-10-27T04:37:21Z) - Surfer 2: The Next Generation of Cross-Platform Computer Use Agents [27.60777497984866]
Surfer 2は3つの環境すべてにわたって最先端のパフォーマンスを実現する統一アーキテクチャである。
WebVoyagerでは97.1%の精度、WebArenaでは69.6%の精度、OSWorldでは60.1%、AndroidWorldでは87.1%の精度が達成され、タスク固有の微調整を伴わない以前のシステムよりも優れていた。
論文 参考訳(メタデータ) (2025-10-22T18:21:52Z) - ZeST: an LLM-based Zero-Shot Traversability Navigation for Unknown Environments [7.419243375193223]
ロボットを危険にさらすことなく、リアルタイムで移動可能なマップを作成するための新しいアプローチであるZeSTを提案する。
提案手法は,ゼロショットトラバーサビリティを実現し,実際のデータ収集に伴うリスクを軽減するだけでなく,高度なナビゲーションシステムの開発も促進する。
論文 参考訳(メタデータ) (2025-08-26T15:30:19Z) - CityNav: A Large-Scale Dataset for Real-World Aerial Navigation [25.51740922661166]
航空VLNのための最初の大規模実世界のデータセットであるCityNavを紹介する。
我々のデータセットは32,637人の実証軌道で構成されており、それぞれに自然言語の記述が組み合わされている。
ナビゲーション中に補助的なモダリティ入力として使用できる地理意味マップを作成する方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T12:08:27Z) - TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments [0.6597195879147555]
TopoNavは、スパース・リワード設定における効率的な目標指向の探索とナビゲーションのための新しいフレームワークである。
TopoNavは環境のトポロジカルマップを動的に構築し、主要な場所と経路をキャプチャする。
本研究では,Clearpath Jackalロボットを用いて,シミュレーションと実世界のオフロード環境におけるTopoNavの評価を行った。
論文 参考訳(メタデータ) (2024-02-06T15:05:25Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。
我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。
我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文 参考訳(メタデータ) (2023-07-28T16:03:28Z) - Aeolus Ocean -- A simulation environment for the autonomous
COLREG-compliant navigation of Unmanned Surface Vehicles using Deep
Reinforcement Learning and Maritime Object Detection [0.0]
海上部門における無人水上機(USV)の航行自律性は、より安全な水と運用コストの削減につながる可能性がある。
本稿では, 現実的な海洋シミュレーション環境において, COLREG 準拠の DRL を用いた衝突回避航法システムの開発について述べる。
論文 参考訳(メタデータ) (2023-07-13T11:20:18Z) - CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-06-17T11:44:04Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z) - Active Visual Information Gathering for Vision-Language Navigation [115.40768457718325]
視覚言語ナビゲーション(VLN)は、エージェントがフォトリアリスティックな環境の中でナビゲーションの指示を行うためのタスクである。
VLNの重要な課題の1つは、曖昧な指示による不確実性を緩和し、環境の観察を不十分にすることで、堅牢なナビゲーションを行う方法である。
この研究は、人間のナビゲーション行動からインスピレーションを得て、よりインテリジェントなVLNポリシーのためのアクティブな情報収集能力を持つエージェントを提供する。
論文 参考訳(メタデータ) (2020-07-15T23:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。