論文の概要: Improving Assistive Robotics with Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2209.02160v1
- Date: Mon, 5 Sep 2022 22:43:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:51:27.318930
- Title: Improving Assistive Robotics with Deep Reinforcement Learning
- Title(参考訳): 深層強化学習による補助ロボットの改良
- Authors: Yash Jakhotiya and Iman Haque
- Abstract要約: Assistive Gym環境における3つのタスクでロボットを訓練するためのベースラインを複製する。
本稿では,リカレントニューラルネットワークとファシックポリシーグラディエント学習を用いて,オリジナル作品の拡張について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Assistive Robotics is a class of robotics concerned with aiding humans in
daily care tasks that they may be inhibited from doing due to disabilities or
age. While research has demonstrated that classical control methods can be used
to design policies to complete these tasks, these methods can be difficult to
generalize to a variety of instantiations of a task. Reinforcement learning can
provide a solution to this issue, wherein robots are trained in simulation and
their policies are transferred to real-world machines. In this work, we
replicate a published baseline for training robots on three tasks in the
Assistive Gym environment, and we explore the usage of a Recurrent Neural
Network and Phasic Policy Gradient learning to augment the original work. Our
baseline implementation meets or exceeds the baseline of the original work,
however, we found that our explorations into the new methods was not as
effective as we anticipated. We discuss the results of our baseline, and some
thoughts on why our new methods were not successful.
- Abstract(参考訳): アシスティヴ・ロボティクス(Assistive Robotics)は、障害者や年齢による行為を抑えることができる日々のケア作業を支援するロボット工学のクラスである。
古典的な制御手法はこれらのタスクを完了させるためにポリシーを設計するのに使用できるが、これらの方法がタスクの様々なインスタンス化に一般化することは困難である。
強化学習は、ロボットがシミュレーションで訓練され、そのポリシーが現実世界のマシンに転送される、この問題に対する解決策を提供する。
本研究では,アシスティブガイム環境における3つのタスクでロボットを訓練するためのベースラインを再現し,リカレントニューラルネットワークとファシックポリシーのグラディエント学習を用いて,元の作業を強化することを検討した。
ベースライン実装はオリジナルの作業のベースラインを満たしたり超えたりしていますが、新しい手法の探索は期待したほど効果的ではなかったことが分かりました。
ベースラインの結果と、新しいメソッドがうまくいかなかった理由についていくつか考えています。
関連論文リスト
- Advancing Household Robotics: Deep Interactive Reinforcement Learning for Efficient Training and Enhanced Performance [0.0]
強化学習(Reinforcement Learning, RL)は、ロボットが環境と対話することを可能にする重要なロボティクス技術として登場した。
本稿では,Deep Interactive Reinforcement Learningを通じて情報とアドバイスを保存・再利用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-29T01:46:50Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from
Offline Data [101.43350024175157]
自己指導型学習は、制御戦略を学ぶのに必要な人間のアノテーションとエンジニアリングの労力を減らす可能性がある。
我々の研究は、強化学習(RL)自体が自己監督的な問題であることを示す先行研究に基づいている。
コントラスト学習に基づく自己教師付きRLアルゴリズムは,実世界の画像に基づくロボット操作タスクを解くことができることを示す。
論文 参考訳(メタデータ) (2023-06-06T01:36:56Z) - Don't Start From Scratch: Leveraging Prior Data to Automate Robotic
Reinforcement Learning [70.70104870417784]
強化学習(RL)アルゴリズムは、ロボットシステムの自律的なスキル獲得を可能にするという約束を持っている。
現実のロボットRLは、通常、環境をリセットするためにデータ収集と頻繁な人間の介入を必要とする。
本研究では,従来のタスクから収集した多様なオフラインデータセットを効果的に活用することで,これらの課題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2022-07-11T08:31:22Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Reinforcement Learning Experiments and Benchmark for Solving Robotic
Reaching Tasks [0.0]
強化学習はロボットアームによる到達タスクの解決に成功している。
ハイドサイト体験再生探索技術により報奨信号の増大が, オフ・ポリティクス・エージェントの平均リターンを増加させることが示されている。
論文 参考訳(メタデータ) (2020-11-11T14:00:49Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z) - Efficient reinforcement learning control for continuum robots based on
Inexplicit Prior Knowledge [3.3645162441357437]
本稿では,未熟な事前知識に基づく効率的な強化学習手法を提案する。
本手法を用いることで、腱駆動ロボットのアクティブな視覚追跡と距離維持を実現することができる。
論文 参考訳(メタデータ) (2020-02-26T15:47:11Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。