論文の概要: Safe reinforcement learning of dynamic high-dimensional robotic tasks:
navigation, manipulation, interaction
- arxiv url: http://arxiv.org/abs/2209.13308v1
- Date: Tue, 27 Sep 2022 11:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:35:37.435317
- Title: Safe reinforcement learning of dynamic high-dimensional robotic tasks:
navigation, manipulation, interaction
- Title(参考訳): 動的高次元ロボットタスクの安全強化学習:ナビゲーション,操作,インタラクション
- Authors: Puze Liu, Kuo Zhang, Davide Tateo, Snehal Jauhri, Zhiyuan Hu, Jan
Peters and Georgia Chalvatzaki
- Abstract要約: 強化学習では、損傷を起こさない環境を探索する上で、安全はより基本的なものである。
本稿では,各種ロボット作業の強化学習のための安全探索の新たな定式化について紹介する。
我々のアプローチは、幅広い種類のロボットプラットフォームに適用され、データから学んだ複雑な衝突制約の下でも安全を強制する。
- 参考スコア(独自算出の注目度): 31.553783147007177
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety is a crucial property of every robotic platform: any control policy
should always comply with actuator limits and avoid collisions with the
environment and humans. In reinforcement learning, safety is even more
fundamental for exploring an environment without causing any damage. While
there are many proposed solutions to the safe exploration problem, only a few
of them can deal with the complexity of the real world. This paper introduces a
new formulation of safe exploration for reinforcement learning of various
robotic tasks. Our approach applies to a wide class of robotic platforms and
enforces safety even under complex collision constraints learned from data by
exploring the tangent space of the constraint manifold. Our proposed approach
achieves state-of-the-art performance in simulated high-dimensional and dynamic
tasks while avoiding collisions with the environment. We show safe real-world
deployment of our learned controller on a TIAGo++ robot, achieving remarkable
performance in manipulation and human-robot interaction tasks.
- Abstract(参考訳): 安全はあらゆるロボットプラットフォームの重要な特性であり、あらゆる制御ポリシーは常にアクチュエータの制限に準拠し、環境や人間との衝突を避けるべきである。
強化学習において、環境を探索する上で安全性はより基本的なものである。
安全な探査問題には多くの解決策が提案されているが、現実世界の複雑さに対処できるものはごくわずかである。
本稿では,各種ロボット作業の強化学習のための安全探索の新しい定式化を提案する。
提案手法は多種多様なロボットプラットフォームに適用され,制約多様体の接空間を探索することにより,データから得られた複雑な衝突制約の下でも安全性を向上する。
提案手法は, 環境との衝突を回避しつつ, シミュレーションによる高次元および動的タスクの最先端性能を実現する。
TIAGo++ロボットに学習コントローラを安全に配置し、操作や人間とロボットのインタラクションタスクにおいて優れた性能を発揮する。
関連論文リスト
- Deception Game: Closing the Safety-Learning Loop in Interactive Robot
Autonomy [7.915956857741506]
既存の安全手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。
本稿では,ロボットの進化する不確実性を明示的に考慮した安全制御ポリシを合成するための,新しいクローズドループパラダイムを提案する。
論文 参考訳(メタデータ) (2023-09-03T20:34:01Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - A Contact-Safe Reinforcement Learning Framework for Contact-Rich Robot
Manipulation [5.0768619194124005]
本稿では,コンタクトリッチロボット操作のためのコンタクトセーフ強化学習フレームワークを提案する。
RLポリシーがロボットアームと環境の予期せぬ衝突を引き起こすと、我々のフレームワークはすぐに衝突を検出し、接触力を小さくすることができる。
本手法は, 予期せぬ衝突のシナリオ下であっても, タスク空間とジョイント空間の両方で接触力を小さく抑えることができる。
論文 参考訳(メタデータ) (2022-07-27T10:35:44Z) - Regularized Deep Signed Distance Fields for Reactive Motion Generation [30.792481441975585]
距離に基づく制約は、ロボットが自分の行動を計画し、安全に行動できるようにするための基本となる。
本研究では,任意のスケールでスムーズな距離場を計算できる単一暗黙関数ReDSDFを提案する。
共有作業空間における全身制御(WBC)と安全なヒューマンロボットインタラクション(HRI)のための代表的タスクにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-09T14:21:32Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement
Learning [49.04274612323564]
障害物回避は、移動ロボットの自律ナビゲーションのための根本的かつ困難な問題です。
本稿では,ロボットが単一眼カメラにのみ依存しなければならない単純な3D環境における障害物回避の問題を検討する。
データ駆動型エンドツーエンドディープラーニングアプローチとして,障害回避問題に取り組む。
論文 参考訳(メタデータ) (2021-03-08T13:05:46Z) - Towards Coordinated Robot Motions: End-to-End Learning of Motion
Policies on Transform Trees [63.31965375413414]
人間による実証から構造化政策を学習し、マルチタスクの課題解決を提案します。
我々の構造化ポリシーは、異なる空間におけるサブタスクポリシーを組み合わせるためのフレームワークであるRMPflowにインスパイアされている。
マルチタスク問題に適したエンドツーエンドの学習目標関数を導き出します。
論文 参考訳(メタデータ) (2020-12-24T22:46:22Z) - COCOI: Contact-aware Online Context Inference for Generalizable
Non-planar Pushing [87.7257446869134]
一般的なコンタクトリッチな操作問題は、ロボット工学における長年の課題である。
深層強化学習は、ロボット操作タスクの解決に大きな可能性を示している。
動的プロパティのコンテキスト埋め込みをオンラインにエンコードする深層RL法であるCOCOIを提案する。
論文 参考訳(メタデータ) (2020-11-23T08:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。