論文の概要: Learning Human-Inspired Force Strategies for Robotic Assembly
- arxiv url: http://arxiv.org/abs/2303.12440v1
- Date: Wed, 22 Mar 2023 10:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-23 14:23:09.508734
- Title: Learning Human-Inspired Force Strategies for Robotic Assembly
- Title(参考訳): ロボット組立のためのヒューマンインスパイアされた力戦略の学習
- Authors: Stefan Scherzinger, Arne Roennau, R\"udiger Dillmann
- Abstract要約: 力に敏感な組み立ては、製造と自動化において重要な要素である。
このような戦略を人間のパフォーマンスから学ぶことは有望なアプローチだが、2つの共通の課題に直面している。
ロボットレスシミュレーションで簡単にオフラインで取得できるデータから確率的力戦略を学習することで、これらの2つの課題に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The programming of robotic assembly tasks is a key component in manufacturing
and automation. Force-sensitive assembly, however, often requires reactive
strategies to handle slight changes in positioning and unforeseen part jamming.
Learning such strategies from human performance is a promising approach, but
faces two common challenges: the handling of low part clearances which is
difficult to capture from demonstrations and learning intuitive strategies
offline without access to the real hardware. We address these two challenges by
learning probabilistic force strategies from data that are easily acquired
offline in a robot-less simulation from human demonstrations with a joystick.
We combine a Long Short Term Memory (LSTM) and a Mixture Density Network (MDN)
to model human-inspired behavior in such a way that the learned strategies
transfer easily onto real hardware. The experiments show a UR10e robot that
completes a plastic assembly with clearances of less than 100 micrometers whose
strategies were solely demonstrated in simulation.
- Abstract(参考訳): ロボット組立タスクのプログラミングは、製造と自動化において重要な要素である。
しかし、力に敏感なアセンブリは、位置決めや予期せぬ部分ジャミングのわずかな変化に対処するために、しばしばリアクティブな戦略を必要とする。
このような戦略を人間のパフォーマンスから学ぶことは有望なアプローチだが、デモから捉えるのが難しい低い部分のクリアランスの扱いと、実際のハードウェアにアクセスせずに直感的な戦略をオフラインで学ぶという2つの一般的な課題に直面している。
ジョイスティックを用いた人間の実演からロボットレスシミュレーションによりオフラインで取得し易いデータから確率的力戦略を学ぶことにより,この2つの課題に対処した。
短期記憶(lstm)と混合密度ネットワーク(mdn)を組み合わせることで,学習戦略が実ハードウェアに容易に移行できるように,人間に触発された動作をモデル化する。
実験では、シミュレーションでのみ実証された100マイクロメートル未満のクリアランスでプラスチックの組み立てを完了するUR10eロボットが示されている。
関連論文リスト
- SWBT: Similarity Weighted Behavior Transformer with the Imperfect
Demonstration for Robotic Manipulation [32.78083518963342]
SWBT(Simisity Weighted Behavior Transformer)という新しいフレームワークを提案する。
SWBTは、環境との相互作用なしに、専門家と不完全なデモンストレーションの両方から効果的に学習する。
我々は、ロボット操作タスクのオフライン模倣学習環境に不完全なデモンストレーションを統合する試みを初めて行った。
論文 参考訳(メタデータ) (2024-01-17T04:15:56Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Bi-Manual Block Assembly via Sim-to-Real Reinforcement Learning [24.223788665601678]
2つのxArm6ロボットがU字型組立タスクを、シミュレーションで90%以上、実際のハードウェアで50%の確率で解決する。
以上の結果から,本システムは今後,深部RLおよびSim2Real転送バイマニュアルポリアの研究を刺激していきたいと願っている。
論文 参考訳(メタデータ) (2023-03-27T01:25:24Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Strategy Discovery and Mixture in Lifelong Learning from Heterogeneous
Demonstration [1.2891210250935146]
実証から学ぶ(LfD)アプローチは、エンドユーザに望ましい振る舞いのデモンストレーションを通じて、ロボットに新しいタスクを教えることを促す。
本稿では,異種間における共通知識を抽出する動的マルチストラテジー・リワード蒸留法(DMSRD)を提案する。
当社のパーソナライズ、フェデレーション、生涯にわたるLfDアーキテクチャは、2つの継続的制御問題におけるベンチマークを上回り、ポリシーリターンは平均77%、ログリターンは42%改善しています。
論文 参考訳(メタデータ) (2022-02-14T20:10:25Z) - Learning Robotic Manipulation Skills Using an Adaptive Force-Impedance
Action Space [7.116986445066885]
強化学習は、様々な困難な意思決定タスクにおいて、有望な結果をもたらしました。
高速な人間のような適応制御手法は複雑なロボットの相互作用を最適化するが、非構造化タスクに必要なマルチモーダルフィードバックを統合することができない。
本稿では,階層的学習と適応アーキテクチャにおける学習問題を要因として,両世界を最大限に活用することを提案する。
論文 参考訳(メタデータ) (2021-10-19T12:09:02Z) - On the Emergence of Whole-body Strategies from Humanoid Robot
Push-recovery Learning [32.070068456106895]
シミュレーション環境における汎用的で堅牢なヒューマノイドプッシュリカバリポリシーのトレーニングに,モデルフリーな深層強化学習を適用する。
本手法は高次元全体ヒューマノイド制御を目標とし,iCubヒューマノイド上で検証を行った。
論文 参考訳(メタデータ) (2021-04-29T17:49:20Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。