論文の概要: Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot
- arxiv url: http://arxiv.org/abs/2311.07245v1
- Date: Mon, 13 Nov 2023 11:29:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 14:35:08.543117
- Title: Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot
- Title(参考訳): 触覚に基づく連続力制御政策のシミュレーションからロボットへ
- Authors: Luca Lach, Robert Haschke, Davide Tateo, Jan Peters, Helge Ritter,
J\'ulia Borr\`as, Carme Torras
- Abstract要約: グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。
以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。
シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
- 参考スコア(独自算出の注目度): 19.789369416528604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of tactile sensors in robotics has sparked many ideas on how
robots can leverage direct contact measurements of their environment
interactions to improve manipulation tasks. An important line of research in
this regard is that of grasp force control, which aims to manipulate objects
safely by limiting the amount of force exerted on the object. While prior works
have either hand-modeled their force controllers, employed model-based
approaches, or have not shown sim-to-real transfer, we propose a model-free
deep reinforcement learning approach trained in simulation and then transferred
to the robot without further fine-tuning. We therefore present a simulation
environment that produces realistic normal forces, which we use to train
continuous force control policies. An evaluation in which we compare against a
baseline and perform an ablation study shows that our approach outperforms the
hand-modeled baseline and that our proposed inductive bias and domain
randomization facilitate sim-to-real transfer. Code, models, and supplementary
videos are available on https://sites.google.com/view/rl-force-ctrl
- Abstract(参考訳): ロボット工学における触覚センサーの出現は、ロボットが環境相互作用の直接接触測定を活用して操作作業を改善する方法について、多くのアイデアを生み出した。
この点で重要な研究は、物体に作用する力量を制限することで、物体を安全に操作することを目的とした把持力制御である。
従来の作業では,手動制御,モデルベースアプローチ,あるいはsim-to-realトランスファーを示さなかったが,シミュレーションで訓練されたモデルフリーの深部強化学習手法を提案し,さらに微調整を行なわずにロボットに移行した。
そこで,我々は,連続的な力制御政策を訓練するために使用する,現実的な正常な力を生み出すシミュレーション環境を提案する。
ベースラインと比較し, アブレーション実験を行った結果, 提案手法がハンドモデルベースラインよりも優れており, 提案する帰納的バイアスとドメインランダム化がsim-to-real転送を促進することがわかった。
コード、モデル、補足ビデオはhttps://sites.google.com/view/rl-force-ctrlで入手できる。
関連論文リスト
- Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。