Fugu-MT 論文翻訳(概要): One-4-All: Neural Potential Fields for Embodied Navigation

論文の概要: One-4-All: Neural Potential Fields for Embodied Navigation

arxiv url: http://arxiv.org/abs/2303.04011v3
Date: Sun, 30 Jul 2023 19:56:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-01 23:15:27.066029
Title: One-4-All: Neural Potential Fields for Embodied Navigation
Title（参考訳）: one-4-all:具体的ナビゲーションのための神経電位場
Authors: Sacha Morin, Miguel Saavedra-Ruiz, Liam Paull
Abstract要約: 実世界のナビゲーションには高次元RGB画像を用いた長期計画が必要である。 One-4-All (O4A) は、グラフのないエンドツーエンドのナビゲーションパイプラインを得るために、自己教師付きおよび多様体学習を活用する方法である。 O4Aは,8つの模擬ギブソン屋内環境において長距離目標を達成することができることを示す。
参考スコア（独自算出の注目度）: 10.452316044889177
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A fundamental task in robotics is to navigate between two locations. In particular, real-world navigation can require long-horizon planning using high-dimensional RGB images, which poses a substantial challenge for end-to-end learning-based approaches. Current semi-parametric methods instead achieve long-horizon navigation by combining learned modules with a topological memory of the environment, often represented as a graph over previously collected images. However, using these graphs in practice requires tuning a number of pruning heuristics. These heuristics are necessary to avoid spurious edges, limit runtime memory usage and maintain reasonably fast graph queries in large environments. In this work, we present One-4-All (O4A), a method leveraging self-supervised and manifold learning to obtain a graph-free, end-to-end navigation pipeline in which the goal is specified as an image. Navigation is achieved by greedily minimizing a potential function defined continuously over image embeddings. Our system is trained offline on non-expert exploration sequences of RGB data and controls, and does not require any depth or pose measurements. We show that O4A can reach long-range goals in 8 simulated Gibson indoor environments and that resulting embeddings are topologically similar to ground truth maps, even if no pose is observed. We further demonstrate successful real-world navigation using a Jackal UGV platform.
Abstract（参考訳）: ロボット工学の基本課題は、2つの場所をナビゲートすることだ。特に、現実世界のナビゲーションには高次元RGB画像による長期計画が必要であり、エンドツーエンドの学習ベースアプローチでは大きな課題となる。現在のセミパラメトリック法は、学習したモジュールと環境のトポロジカルメモリを組み合わせ、しばしば以前に収集した画像のグラフとして表されることによって、長い水平ナビゲーションを実現する。しかし、これらのグラフを実際に使用するには、多くのプルーニングヒューリスティックをチューニングする必要がある。これらのヒューリスティックは、スプリアスエッジを避け、ランタイムメモリ使用を制限し、大規模な環境で合理的に高速なグラフクエリを維持するために必要である。本研究では,自己教師型および多様体学習を利用した1-4-All(O4A)を用いて,目標を画像として指定したグラフフリーでエンドツーエンドなナビゲーションパイプラインを得る。ナビゲーションは、画像埋め込み上で連続的に定義されるポテンシャル関数を厳格に最小化する。 rgbデータと制御の非熟練な探索シーケンスでオフラインで訓練され、深さや姿勢の測定は不要である。我々は,8つの模擬ギブソン屋内環境において,O4Aが長距離目標に到達できることを示し,その結果の埋め込みは,たとえポーズが観測されていなくても,位相的に地上の真理写像に類似していることを示した。さらに,Jackal UGVプラットフォームを用いた実世界のナビゲーションの成功例を示す。

関連論文リスト

CREStE: Scalable Mapless Navigation with Internet Scale Priors and Counterfactual Guidance [13.922655150502365]
CREStEは完全なマップレスナビゲーション問題に対処するための表現と報酬を学ぶ。我々はCREStEを6つの異なる都市環境におけるキロメートル規模のナビゲーションタスクで評価した。
論文参考訳（メタデータ） (2025-03-05T21:42:46Z)
GaussNav: Gaussian Splatting for Visual Navigation [92.13664084464514]
インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。視覚ナビゲーションのためのガウススティング(GaussNav)であるIINの新しいフレームワークを提案し、3次元ガウススティング(DGS)に基づく新しい地図表現を構築した。当社のGaussNavフレームワークは,Habitat-Matterport 3D(HM3D)データセットにおいて,SPL(Path Length)によるSuccessの重み付けを0.347から0.578に増加させ,大幅なパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2024-03-18T09:56:48Z)
Right Place, Right Time! Dynamizing Topological Graphs for Embodied Navigation [55.581423861790945]
身体的ナビゲーションのタスクは、探索中にシーンのトポロジカルグラフを構築することを伴うことが多い。我々は、オブジェクト遷移グラフ(OTG)と呼ばれる静的トポロジカルグラフをダイナマイズするために、構造化されたオブジェクト遷移を導入する。 OTGは、人間の習慣にインスパイアされた構造化経路に従って、ポータブルターゲットをシミュレートする。
論文参考訳（メタデータ） (2024-03-14T22:33:22Z)
Feudal Networks for Visual Navigation [6.1190419149081245]
封建的学習を用いた視覚ナビゲーションの新しいアプローチを提案する。各レベルのエージェントはタスクの異なる側面を見て、異なる空間的および時間的スケールで操作する。得られた封建的なナビゲーションネットワークは、SOTAの性能に近い。
論文参考訳（メタデータ） (2024-02-19T20:05:41Z)
Object Goal Navigation with Recursive Implicit Maps [92.6347010295396]
対象目標ナビゲーションのための暗黙的な空間マップを提案する。提案手法は, 挑戦的なMP3Dデータセット上での技量を著しく上回る。我々は、実際のロボットにモデルをデプロイし、実際のシーンでオブジェクトゴールナビゲーションの結果を奨励する。
論文参考訳（メタデータ） (2023-08-10T14:21:33Z)
How To Not Train Your Dragon: Training-free Embodied Object Goal Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文参考訳（メタデータ） (2023-05-26T13:38:33Z)
Learning to Predict Navigational Patterns from Partial Observations [63.04492958425066]
本稿では,実環境におけるナビゲーションのパターンを,部分的な観察のみから推測する,初めての自己教師型学習(SSL)手法を提案する。我々は、DSLPフィールドに最大極大グラフを適合させることにより、グローバルなナビゲーションパターンを推論する方法を実証する。実験により,我々のSSLモデルはnuScenesデータセット上で2つのSOTA教師付きレーングラフ予測モデルより優れていることが示された。
論文参考訳（メタデータ） (2023-04-26T02:08:46Z)
ReVoLT: Relational Reasoning and Voronoi Local Graph Planning for Target-driven Navigation [1.0896567381206714]
Embodied AIは、知的な実体と現実世界の相互作用を強調する必然的なトレンドである。グラフニューラルネットワーク(GNN)によるレイアウト関係の活用に関する研究このタスクを分離し、階層的なフレームワークであるReVoLTを提案する。
論文参考訳（メタデータ） (2023-01-06T05:19:56Z)
ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints [94.60414567852536]
長距離航法には、計画と局所的な移動可能性の推論の両方が必要である。学習と計画を統合する学習に基づくアプローチを提案する。 ViKiNGは、画像ベースの学習コントローラを利用できる。
論文参考訳（メタデータ） (2022-02-23T02:14:23Z)
Lifelong Topological Visual Navigation [16.41858724205884]
本稿では,生涯ナビゲーション性能を時間とともに向上させるグラフ更新戦略を用いた学習型ビジュアルナビゲーション手法を提案する。画像に基づくトポロジグラフを構築するためのサンプリングベースの計画アルゴリズムから着想を得た結果,スペーサーグラフはベースライン法に比べてナビゲーション性能が高い。固定的なトレーニング環境から学習するコントローラとは異なり、ロボットが配置される実環境から比較的小さなデータセットを使ってモデルを微調整できることが示される。
論文参考訳（メタデータ） (2021-10-16T06:16:14Z)
Memory-Augmented Reinforcement Learning for Image-Goal Navigation [67.3963444878746]
本論文では,クロスエピソードメモリを活用したナビゲーション学習法を提案する。オーバーフィッティングを避けるため、トレーニング中にRGB入力にデータ拡張を適用することを提案する。この競合性能はRGB入力のみから得られるが,位置や深度などのセンサは利用できない。
論文参考訳（メタデータ） (2021-01-13T16:30:20Z)
Learning Synthetic to Real Transfer for Localization and Navigational Tasks [7.019683407682642]
ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
論文参考訳（メタデータ） (2020-11-20T08:37:03Z)
Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文参考訳（メタデータ） (2020-08-21T03:16:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。