論文の概要: Robotic Grasp Manipulation Using Evolutionary Computing and Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2001.05443v1
- Date: Wed, 15 Jan 2020 17:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 06:15:41.673106
- Title: Robotic Grasp Manipulation Using Evolutionary Computing and Deep
Reinforcement Learning
- Title(参考訳): 進化計算と深部強化学習を用いたロボットグラス操作
- Authors: Priya Shukla, Hitesh Kumar and G. C. Nandi
- Abstract要約: 人間は、何年にもわたって学習しているので、物体をつかむために操作する方法をすぐに知っています。
本稿では,課題を位置学習と向き学習の両方に分解することで,学習に基づくポーズ推定を開発することの課題を取り上げている。
提案したアーキテクチャとアルゴリズムに基づいて、ロボットは通常の形状の剛体物体をすべて把握することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent Object manipulation for grasping is a challenging problem for
robots. Unlike robots, humans almost immediately know how to manipulate objects
for grasping due to learning over the years. A grown woman can grasp objects
more skilfully than a child because of learning skills developed over years,
the absence of which in the present day robotic grasping compels it to perform
well below the human object grasping benchmarks. In this paper we have taken up
the challenge of developing learning based pose estimation by decomposing the
problem into both position and orientation learning. More specifically, for
grasp position estimation, we explore three different methods - a Genetic
Algorithm (GA) based optimization method to minimize error between calculated
image points and predicted end-effector (EE) position, a regression based
method (RM) where collected data points of robot EE and image points have been
regressed with a linear model, a PseudoInverse (PI) model which has been
formulated in the form of a mapping matrix with robot EE position and image
points for several observations. Further for grasp orientation learning, we
develop a deep reinforcement learning (DRL) model which we name as Grasp Deep
Q-Network (GDQN) and benchmarked our results with Modified VGG16 (MVGG16).
Rigorous experimentations show that due to inherent capability of producing
very high-quality solutions for optimization problems and search problems, GA
based predictor performs much better than the other two models for position
estimation. For orientation learning results indicate that off policy learning
through GDQN outperforms MVGG16, since GDQN architecture is specially made
suitable for the reinforcement learning. Based on our proposed architectures
and algorithms, the robot is capable of grasping all rigid body objects having
regular shapes.
- Abstract(参考訳): 把握のための知的物体操作はロボットにとって難しい問題である。
ロボットとは異なり、人間は長年の学習によって、物をつかむための操作方法をすぐに知っている。
大人の女性は、何年もかけて発達した学習スキルのため、子供よりも巧みに物体をつかむことができ、今日ではロボットによる把持がなければ、人間の物体をつかむベンチマークよりも高いパフォーマンスを発揮できない。
本稿では,この問題を位置学習と方向学習の両方に分解することで,ポーズ推定に基づく学習の課題を提起する。
More specifically, for grasp position estimation, we explore three different methods - a Genetic Algorithm (GA) based optimization method to minimize error between calculated image points and predicted end-effector (EE) position, a regression based method (RM) where collected data points of robot EE and image points have been regressed with a linear model, a PseudoInverse (PI) model which has been formulated in the form of a mapping matrix with robot EE position and image points for several observations.
さらに,グラスプ深度Q-Network (GDQN) と呼ばれる深度強化学習(DRL)モデルを開発し,修正VGG16 (MVGG16) を用いて評価を行った。
厳密な実験により、最適化問題や探索問題に対して、非常に高品質なソリューションを生成する能力があるため、gaベースの予測器は他の2つのモデルよりも高い位置推定性能を発揮することが示されている。
配向学習の結果から,GDQNによるオフポリシー学習は,GDQNアーキテクチャを特に強化学習に適したものにするため,MVGG16より優れていることが示唆された。
提案したアーキテクチャとアルゴリズムに基づいて、ロボットは通常の形状の剛体物体をすべて把握することができる。
関連論文リスト
- Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - On-Robot Bayesian Reinforcement Learning for POMDPs [16.667924736270415]
本稿では,ロボット工学におけるベイズ強化学習を,物理システムのための特殊フレームワークの提案により進める。
この知識を因子表現で捉え、後続の分解を同様の形で示し、最終的にベイズ的枠組みでモデルを定式化する。
次に,モンテカルロ木探索と粒子フィルタリングに基づくサンプルベースオンライン解法を提案する。
論文 参考訳(メタデータ) (2023-07-22T01:16:29Z) - Learning Controllable Adaptive Simulation for Multi-resolution Physics [86.8993558124143]
完全深層学習に基づくサロゲートモデルとして,LAMP(Learning Controllable Adaptive Simulation for Multi- resolution Physics)を導入した。
LAMPは、前方進化を学習するためのグラフニューラルネットワーク(GNN)と、空間的洗練と粗大化のポリシーを学ぶためのGNNベースのアクター批判で構成されている。
我々は,LAMPが最先端のディープラーニングサロゲートモデルより優れており,長期予測誤差を改善するために,適応的なトレードオフ計算が可能であることを実証した。
論文 参考訳(メタデータ) (2023-05-01T23:20:27Z) - Deep Reinforcement Learning Based on Local GNN for Goal-conditioned
Deformable Object Rearranging [1.807492010338763]
オブジェクトの再配置は、ロボットが変形可能なオブジェクトを目標設定に再構成する必要がある、最も一般的な変形可能な操作タスクの1つである。
従来の研究は、モデルベースまたはデータ駆動アプローチによる各タスクのエキスパートシステムの設計に重点を置いていた。
画像から検出されたキーポイントを2つの表現グラフを用いて符号化する局所GNN(Graph Neural Network)に基づく学習法を設計する。
我々のフレームワークはシミュレーションにおける複数の1-D(ロープリング、ロープリング)と2-D(クロース)の再構成作業に有効であり、キーポイント検出器を微調整することで、実際のロボットに容易に移行できる。
論文 参考訳(メタデータ) (2023-02-21T05:21:26Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文 参考訳(メタデータ) (2022-03-31T17:59:38Z) - Learning to Fit Morphable Models [12.469605679847085]
学習最適化の最近の進歩の上に構築し、古典的なレバンス・マルカルトアルゴリズムに触発された更新ルールを提案する。
本稿では,頭部装着装置による3次元体表面推定問題と2次元ランドマークによる顔の嵌合性に対するニューラルネットワークの有効性を示す。
論文 参考訳(メタデータ) (2021-11-29T18:59:53Z) - Development of a robust cascaded architecture for intelligent robot
grasping using limited labelled data [0.0]
ロボットの場合、オブジェクトを効果的に把握する方法を学ぶために多くの時間を費やす余裕はありません。
本稿では,VQVAEに基づく効率的な学習アーキテクチャを提案する。
ラベル付きデータセットが限定された場合でも,より一般化可能な半教師付き学習ベースモデルについて検討した。
論文 参考訳(メタデータ) (2021-11-06T11:01:15Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Robot Navigation in a Crowd by Integrating Deep Reinforcement Learning
and Online Planning [8.211771115758381]
これは、群衆の中で時間効率と衝突のない道を移動するモバイルロボットにとって、まだオープンで挑戦的な問題です。
深層強化学習はこの問題に対する有望な解決策である。
グラフに基づく深部強化学習手法SG-DQNを提案する。
私たちのモデルは、ロボットが群衆をよりよく理解し、群衆ナビゲーションタスクで0.99以上の高い成功率を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-02-26T02:17:13Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。