論文の概要: Composing Dextrous Grasping and In-hand Manipulation via Scoring with a Reinforcement Learning Critic
- arxiv url: http://arxiv.org/abs/2505.13253v1
- Date: Mon, 19 May 2025 15:36:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.703533
- Title: Composing Dextrous Grasping and In-hand Manipulation via Scoring with a Reinforcement Learning Critic
- Title(参考訳): 強化学習批判を用いたスコーリングによるDextrous GraspingとIn-hand Manipulationの合成
- Authors: Lennart Röstel, Dominik Winkelbauer, Johannes Pitz, Leon Sievers, Berthold Bäuml,
- Abstract要約: ロボット工学において、手作業の操作と把握は基本的なものであるが、しばしば別々に対処される。
本稿では,このギャップを埋めるために,手作業で訓練した強化学習エージェントの批判ネットワークを活用する方法を提案する。
実験の結果,本手法は追加訓練を必要とせず,手指操作の成功率を大幅に向上させることがわかった。
- 参考スコア(独自算出の注目度): 7.759447374181355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In-hand manipulation and grasping are fundamental yet often separately addressed tasks in robotics. For deriving in-hand manipulation policies, reinforcement learning has recently shown great success. However, the derived controllers are not yet useful in real-world scenarios because they often require a human operator to place the objects in suitable initial (grasping) states. Finding stable grasps that also promote the desired in-hand manipulation goal is an open problem. In this work, we propose a method for bridging this gap by leveraging the critic network of a reinforcement learning agent trained for in-hand manipulation to score and select initial grasps. Our experiments show that this method significantly increases the success rate of in-hand manipulation without requiring additional training. We also present an implementation of a full grasp manipulation pipeline on a real-world system, enabling autonomous grasping and reorientation even of unwieldy objects.
- Abstract(参考訳): ロボット工学において、手作業の操作と把握は基本的なものであるが、しばしば別々に対処される。
手で操作する政策を導出するために、強化学習は近年大きな成功を収めている。
しかし、導出されたコントローラは、人間のオペレーターがオブジェクトを適切な初期(グラスピング)状態に配置する必要があるため、現実世界のシナリオでは、まだ有用ではない。
望ましい手動操作の目標を促進するための安定した把握を見つけることは、オープンな問題である。
本研究では,このギャップを埋める手法として,手動操作で訓練した強化学習エージェントの批判的ネットワークを活用して,初期知識を抽出する手法を提案する。
実験の結果,本手法は追加訓練を必要とせず,手指操作の成功率を大幅に向上させることがわかった。
また,実世界のシステム上でのフルグリップ操作パイプラインの実装も提案する。
関連論文リスト
- COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping [56.907940167333656]
集積ロボットグルーピングは、表面衝突などの環境制約により、所望のグルーピングポーズが運動的に不可能な場所である。
従来のロボット操作アプローチは、人間が一般的に使用する非包括的または双対的戦略の複雑さに苦しむ。
本稿では,2つの協調ポリシーを活用する学習ベースアプローチであるCOMBO-Grasp(Constraint-based Manipulation for Bimanual Occluded Grasping)を紹介する。
論文 参考訳(メタデータ) (2025-02-12T01:31:01Z) - Towards Real-World Efficiency: Domain Randomization in Reinforcement Learning for Pre-Capture of Free-Floating Moving Targets by Autonomous Robots [0.0]
本研究では,微小重力環境下でのロボットプレグラスピングの複雑な課題に対処するために,深層強化学習に基づく制御手法を提案する。
本手法は,ソフトアクター・クリティックな手法を用いて,自由な移動物体にグリッパーが十分に接近できるように,非政治強化学習の枠組みを取り入れたものである。
プレグラスピングのアプローチタスクを効果的に学習するために,エージェントに明確で洞察に富んだフィードバックを提供する報酬関数を開発した。
論文 参考訳(メタデータ) (2024-06-10T16:54:51Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - Trajectory-based Reinforcement Learning of Non-prehensile Manipulation
Skills for Semi-Autonomous Teleoperation [18.782289957834475]
本稿では,RGB-Dセンサを用いたピックアップ・アンド・プレイスタスクのための半自律遠隔操作フレームワークを提案する。
トラジェクトリに基づく強化学習を用いて、非包括的操作を学習し、物体を再構成する。
提案手法は,握り時間の観点から手動キーボード制御よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-09-27T14:27:28Z) - On the Feasibility of Learning Finger-gaiting In-hand Manipulation with
Intrinsic Sensing [0.7373617024876725]
モデルフリー強化学習を用いて, 指先を正確に把握することで, 指先の動きを学習する。
精度把握の本質的な不安定性に対処するために,初期状態分布の利用を提案する。
本手法は, 最先端技術よりも, サンプルの複雑さを大幅に改善して, 指球運動を学習することができる。
論文 参考訳(メタデータ) (2021-09-26T23:22:29Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z) - An Empowerment-based Solution to Robotic Manipulation Tasks with Sparse
Rewards [14.937474939057596]
ロボットマニピュレータは、非常にまばらな指示信号しか提供されていなくても、タスクを達成できることを学ぶことが重要である。
本稿では,任意の標準強化学習アルゴリズムに容易に組み込むことができる本質的な動機づけ手法を提案する。
論文 参考訳(メタデータ) (2020-10-15T19:06:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。