論文の概要: Watch Your STEPP: Semantic Traversability Estimation using Pose Projected Features
- arxiv url: http://arxiv.org/abs/2501.17594v1
- Date: Wed, 29 Jan 2025 11:53:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:53:25.289100
- Title: Watch Your STEPP: Semantic Traversability Estimation using Pose Projected Features
- Title(参考訳): STEPP: Pose Projected Features を用いた意味的トレーサビリティ推定
- Authors: Sebastian Ægidius, Dennis Hadjivelichkov, Jianhao Jiao, Jonathan Embley-Riches, Dimitrios Kanoulas,
- Abstract要約: 人間の歩行のデモンストレーションから学ぶことにより,地形の移動性を評価する手法を提案する。
提案手法は,DINOv2視覚変換器モデルを用いて生成した高密度画素ワイドな特徴埋め込みを利用する。
損失を最小化することにより、ネットワークは、低い復元誤差で見慣れた地形と、高い復元誤差で見慣れないまたは危険な地形とを区別する。
- 参考スコア(独自算出の注目度): 4.392942391043664
- License:
- Abstract: Understanding the traversability of terrain is essential for autonomous robot navigation, particularly in unstructured environments such as natural landscapes. Although traditional methods, such as occupancy mapping, provide a basic framework, they often fail to account for the complex mobility capabilities of some platforms such as legged robots. In this work, we propose a method for estimating terrain traversability by learning from demonstrations of human walking. Our approach leverages dense, pixel-wise feature embeddings generated using the DINOv2 vision Transformer model, which are processed through an encoder-decoder MLP architecture to analyze terrain segments. The averaged feature vectors, extracted from the masked regions of interest, are used to train the model in a reconstruction-based framework. By minimizing reconstruction loss, the network distinguishes between familiar terrain with a low reconstruction error and unfamiliar or hazardous terrain with a higher reconstruction error. This approach facilitates the detection of anomalies, allowing a legged robot to navigate more effectively through challenging terrain. We run real-world experiments on the ANYmal legged robot both indoor and outdoor to prove our proposed method. The code is open-source, while video demonstrations can be found on our website: https://rpl-cs-ucl.github.io/STEPP
- Abstract(参考訳): 地形の移動性を理解することは、自律的なロボットナビゲーション、特に自然景観のような非構造環境において不可欠である。
占有マッピングのような伝統的な手法は基本的な枠組みを提供するが、脚のあるロボットのようなプラットフォームで複雑な移動能力を考慮できないことが多い。
本研究では,人間の歩行のデモンストレーションから学ぶことにより,地形の移動性を評価する手法を提案する。
提案手法は,エンコーダ・デコーダ MLP アーキテクチャを用いて,DINOv2 ビジョントランスフォーマーモデルを用いて生成した高密度な画素ワイドな特徴埋め込みを利用して地形セグメントを解析する。
興味のあるマスキング領域から抽出された平均特徴ベクトルは、再構成ベースのフレームワークでモデルをトレーニングするために使用される。
復元損失を最小化することにより、ネットワークは、低い再構成誤差でよく知られた地形と、高い再構成誤差で見慣れないあるいは危険な地形とを区別する。
このアプローチは異常の検出を容易にし、脚のあるロボットが挑戦的な地形を通ってより効果的に移動できるようにする。
提案手法を実証するために,ANYmal脚ロボットを用いた実環境実験を行った。
コードはオープンソースで、ビデオデモは私たちのWebサイト(https://rpl-cs-ucl.github.io/STEPP)で見ることができる。
関連論文リスト
- NeuPAN: Direct Point Robot Navigation with End-to-End Model-based Learning [67.53972459080437]
乱雑で未知の環境で非ホロノミックロボットをナビゲートするには、リアルタイム衝突回避のための正確な認識と正確な動きが必要である。
本稿では, リアルタイム, 高精度, 地図のない, 展開が容易で, 環境によらないロボットモーションプランナであるNeuPANについて述べる。
論文 参考訳(メタデータ) (2024-03-11T15:44:38Z) - Neural Potential Field for Obstacle-Aware Local Motion Planning [46.42871544295734]
本稿では,ロボットのポーズ,障害物マップ,ロボットのフットプリントに基づいて,異なる衝突コストを返却するニューラルネットワークモデルを提案する。
私たちのアーキテクチャには、障害物マップとロボットフットプリントを埋め込みに変換するニューラルイメージエンコーダが含まれています。
Husky UGVモバイルロボットの実験は、我々のアプローチがリアルタイムで安全なローカルプランニングを可能にすることを示した。
論文 参考訳(メタデータ) (2023-10-25T05:00:21Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - IR-MCL: Implicit Representation-Based Online Global Localization [31.77645160411745]
本稿では,室内環境におけるロボットの姿勢を2次元LiDARデータを用いて推定する問題に対処する。
ニューラルネットワークを用いてシーンを暗黙的に表現するためのニューラルネットワーク占有場(NOF)を提案する。
本研究では,最先端手法のローカライズ性能を超越したアプローチを用いて,ロボットを高精度かつ効率的にローカライズできることを示す。
論文 参考訳(メタデータ) (2022-10-06T17:59:08Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - Complex Terrain Navigation via Model Error Prediction [5.937673383513695]
私たちは、オンラインのアプローチでトレーニングを行い、その結果、シミュレーションと現実世界にまたがる、50分間のトレーニングデータを使用して、ナビゲーションポリシーを成功させました。
学習に基づくナビゲーションシステムは,Clearpath Huskyが様々な地形を航行する様子を実演する,効率的な短期プランナーである。
論文 参考訳(メタデータ) (2021-11-18T15:55:04Z) - Solving Occlusion in Terrain Mapping with Neural Networks [7.703348666813963]
本研究では,実世界のデータに基づいて,地上情報を必要としない自己教師付き学習手法を提案する。
私たちのニューラルネットワークは、自律的な地上ロボットに適したサンプリングレートで、CPUとGPUの両方でリアルタイムで実行できます。
論文 参考訳(メタデータ) (2021-09-15T08:30:16Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。