論文の概要: Learning Perceptual Locomotion on Uneven Terrains using Sparse Visual
Observations
- arxiv url: http://arxiv.org/abs/2109.14026v1
- Date: Tue, 28 Sep 2021 20:25:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 14:39:27.716376
- Title: Learning Perceptual Locomotion on Uneven Terrains using Sparse Visual
Observations
- Title(参考訳): 疎視的観察による不均一地形の知覚ロコモーション学習
- Authors: Fernando Acero, Kai Yuan, Zhibin Li
- Abstract要約: この研究は、人中心の環境において、よく見られるバンプ、ランプ、階段の広い範囲にわたる知覚的移動を達成するために、スパースな視覚的観察の使用を活用することを目的としている。
まず、関心の均一な面を表すことのできる最小限の視覚入力を定式化し、このような外受容的・固有受容的データを統合した学習フレームワークを提案する。
本研究では, 平地を全方向歩行し, 障害物のある地形を前方移動させるタスクにおいて, 学習方針を検証し, 高い成功率を示す。
- 参考スコア(独自算出の注目度): 75.60524561611008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Legged robots have achieved remarkable performance in blind walking using
either model-based control or data-driven deep reinforcement learning. To
proactively navigate and traverse various terrains, active use of visual
perception becomes indispensable, and this work aims to exploit the use of
sparse visual observations to achieve perceptual locomotion over a range of
commonly seen bumps, ramps, and stairs in human-centred environments. We first
formulate the selection of minimal visual input that can represent the uneven
surfaces of interest, and propose a learning framework that integrates such
exteroceptive and proprioceptive data. We specifically select state
observations and design a training curriculum to learn feedback control
policies more effectively over a range of different terrains. Using an
extensive benchmark, we validate the learned policy in tasks that require
omnidirectional walking over flat ground and forward locomotion over terrains
with obstacles, showing a high success rate of traversal. Particularly, the
robot performs autonomous perceptual locomotion with minimal visual perception
using depth measurements, which are easily available from a Lidar or RGB-D
sensor, and successfully demonstrates robust ascent and descent over high
stairs of 20 cm step height, i.e., 50% of its leg length.
- Abstract(参考訳): 脚のついたロボットは、モデルベースの制御やデータ駆動の深層強化学習を用いて、目隠しで顕著なパフォーマンスを達成した。
様々な地形を積極的にナビゲートし横断するために,視覚知覚の活発な利用が不可欠となり,人間の中心環境において広く見られるバンプ,ランプ,階段の広い範囲にわたる知覚的移動を実現するために,まばらな視覚観察を利用することが目的である。
まず,興味のある不均一な面を表現できる最小の視覚入力の選択を定式化し,そのような非知覚的・固有的データを統合する学習フレームワークを提案する。
具体的には、様々な地形において、フィードバック制御ポリシーをより効果的に学習する訓練カリキュラムを選定し、設計する。
広域ベンチマークを用いて, 障害物のある地形上を全方向歩行し, 前方移動する必要があるタスクにおいて, 学習方針を検証し, トラバーサルの成功率が高いことを示す。
特に、このロボットは、LidarまたはRGB-Dセンサーから容易に得ることができる深度測定を用いて、最小限の視覚知覚で自律的な知覚運動を行い、20cmの高さの高階段上の頑丈な昇降、すなわち脚の長さの50%を成功させる。
関連論文リスト
- Human Insights Driven Latent Space for Different Driving Perspectives: A Unified Encoder for Efficient Multi-Task Inference [43.474068248379815]
本稿では,都市ナビゲーションに不可欠な複数のコンピュータビジョンタスクを訓練した共有エンコーダを提案する。
ポーズ推定のためのマルチスケール特徴ネットワークを導入し,深度学習を改善する。
その結果,多様な視覚的タスクを訓練した共有バックボーンは,全体的な知覚能力を提供することができることがわかった。
論文 参考訳(メタデータ) (2024-09-16T08:54:03Z) - StairNet: Visual Recognition of Stairs for Human-Robot Locomotion [2.3811618212533663]
StairNetは、階段の視覚的感知と認識のための新しいディープラーニングモデルの開発を支援するイニシアチブである。
本稿では,515,000枚以上の手動ラベル付き画像を用いた大規模データセットの開発について概説する。
ロボット移動のための新しい視覚認識システムを開発・研究する上で,StairNetは有効なプラットフォームであることを示す。
論文 参考訳(メタデータ) (2023-10-31T17:30:57Z) - Learning Navigational Visual Representations with Semantic Map
Supervision [85.91625020847358]
エージェントの自我中心のビューとセマンティックマップを対比してナビゲーション固有の視覚表現学習法を提案する。
Ego$2$-Map学習は、オブジェクト、構造、遷移などのコンパクトでリッチな情報を、ナビゲーションのためのエージェントのエゴセントリックな表現に転送する。
論文 参考訳(メタデータ) (2023-07-23T14:01:05Z) - Fast Traversability Estimation for Wild Visual Navigation [17.015268056925745]
トラバーサビリティ推定のためのオンライン自己教師型学習システムであるWild Visual Navigation (WVN)を提案する。
このシステムは、現場での短い人間のデモから継続的に適応することができる。
森林・公園・草地における挑戦的環境における実験・アブレーション研究によるアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-05-15T10:19:30Z) - Learning to See before Learning to Act: Visual Pre-training for
Manipulation [48.731528716324355]
視覚タスクの事前学習は、物体を操作するための学習の一般化とサンプル効率を大幅に向上させる。
本稿では,モデルパラメータを視覚ネットワークからアベイランス予測ネットワークへ直接転送することで,ゼロショット適応が成功することを示す。
ほんの少しのロボット経験があれば、より優れた結果を得るために、余分なモデルをさらに微調整できる。
論文 参考訳(メタデータ) (2021-07-01T17:58:37Z) - Crop-Transform-Paste: Self-Supervised Learning for Visual Tracking [137.26381337333552]
本研究では,十分なトレーニングデータを合成できるCrop-Transform-Paste演算を開発した。
オブジェクトの状態はすべての合成データで知られているので、既存のディープトラッカーは人間のアノテーションなしで日常的に訓練することができる。
論文 参考訳(メタデータ) (2021-06-21T07:40:34Z) - Rapid Exploration for Open-World Navigation with Latent Goal Models [78.45339342966196]
多様なオープンワールド環境における自律的な探索とナビゲーションのためのロボット学習システムについて述べる。
本手法のコアとなるのは、画像の非パラメトリックトポロジカルメモリとともに、距離と行動の学習された潜在変数モデルである。
学習方針を規則化するために情報ボトルネックを使用し、(i)目標のコンパクトな視覚的表現、(ii)一般化能力の向上、(iii)探索のための実行可能な目標をサンプリングするためのメカニズムを提供する。
論文 参考訳(メタデータ) (2021-04-12T23:14:41Z) - What Can You Learn from Your Muscles? Learning Visual Representation
from Human Interactions [50.435861435121915]
視覚のみの表現よりも優れた表現を学べるかどうかを調べるために,人間のインタラクションとアテンション・キューを用いている。
実験の結果,我々の「音楽監督型」表現は,視覚のみの最先端手法であるMoCoよりも優れていた。
論文 参考訳(メタデータ) (2020-10-16T17:46:53Z) - Robot Perception enables Complex Navigation Behavior via Self-Supervised
Learning [23.54696982881734]
本稿では、強化学習(RL)によるアクティブな目標駆動ナビゲーションタスクのためのロボット認識システムの統合手法を提案する。
提案手法は,1つの画像列から直接自己スーパービジョンを用いて得られる,コンパクトな動きと視覚知覚データを時間的に組み込む。
我々は,新しいインタラクティブなCityLearnフレームワークを用いて,実世界の運転データセットであるKITTIとOxford RobotCarのアプローチを実証した。
論文 参考訳(メタデータ) (2020-06-16T07:45:47Z) - Active Perception and Representation for Robotic Manipulation [0.8315801422499861]
本稿では、能動的知覚の利点を利用して操作タスクを遂行するフレームワークを提案する。
我々のエージェントは、視点変化を利用してオブジェクトをローカライズし、状態表現を自己監督的に学習し、ゴール指向のアクションを実行する。
バニラ深度Q-ラーニングアルゴリズムと比較して、我々のモデルは少なくとも4倍のサンプリング効率がある。
論文 参考訳(メタデータ) (2020-03-15T01:43:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。