論文の概要: Exploratory Grasping: Asymptotically Optimal Algorithms for Grasping
Challenging Polyhedral Objects
- arxiv url: http://arxiv.org/abs/2011.05632v2
- Date: Thu, 12 Nov 2020 01:21:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 23:42:01.765438
- Title: Exploratory Grasping: Asymptotically Optimal Algorithms for Grasping
Challenging Polyhedral Objects
- Title(参考訳): 探索的グラッピング:多面体をグラッピングする漸近的最適アルゴリズム
- Authors: Michael Danielczuk, Ashwin Balakrishna, Daniel S. Brown, Shivin
Devgon, Ken Goldberg
- Abstract要約: 本研究では,未知の多面体物体の信頼度を効率的に把握するための新しい問題設定である探索グラフ作成法を提案する。
オンラインラピッドグラフ探索戦略(BORGES)のための効率的なバンディットスタイルのアルゴリズムを提案する。
BORGESは、汎用的な把握パイプラインと、他の2つのオンライン学習アルゴリズムを大きく上回る。
- 参考スコア(独自算出の注目度): 31.82394962213321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There has been significant recent work on data-driven algorithms for learning
general-purpose grasping policies. However, these policies can consistently
fail to grasp challenging objects which are significantly out of the
distribution of objects in the training data or which have very few high
quality grasps. Motivated by such objects, we propose a novel problem setting,
Exploratory Grasping, for efficiently discovering reliable grasps on an unknown
polyhedral object via sequential grasping, releasing, and toppling. We
formalize Exploratory Grasping as a Markov Decision Process, study the
theoretical complexity of Exploratory Grasping in the context of reinforcement
learning and present an efficient bandit-style algorithm, Bandits for Online
Rapid Grasp Exploration Strategy (BORGES), which leverages the structure of the
problem to efficiently discover high performing grasps for each object stable
pose. BORGES can be used to complement any general-purpose grasping algorithm
with any grasp modality (parallel-jaw, suction, multi-fingered, etc) to learn
policies for objects in which they exhibit persistent failures. Simulation
experiments suggest that BORGES can significantly outperform both
general-purpose grasping pipelines and two other online learning algorithms and
achieves performance within 5% of the optimal policy within 1000 and 8000
timesteps on average across 46 challenging objects from the Dex-Net adversarial
and EGAD! object datasets, respectively. Initial physical experiments suggest
that BORGES can improve grasp success rate by 45% over a Dex-Net baseline with
just 200 grasp attempts in the real world. See https://tinyurl.com/exp-grasping
for supplementary material and videos.
- Abstract(参考訳): 汎用的把握ポリシーを学習するためのデータ駆動アルゴリズムに関する最近の研究が盛んである。
しかし、これらのポリシーは、トレーニングデータ内のオブジェクトの分布から著しく外れた、あるいは高品質な把握が極めて少ない挑戦的なオブジェクトを、一貫して把握できない可能性がある。
このようなオブジェクトをモチベーションとして,未知の多面体オブジェクトのシーケンシャルな把握,解放,切り抜きによる信頼性の高い把握を効率的に検出する,新しい問題設定であるExploratory Graspingを提案する。
我々はマルコフ決定過程として探索グラフ作成を定式化し、強化学習の文脈で探索グラフ作成の理論的複雑さを考察し、各オブジェクトの安定なポーズに対する高いパフォーマンスの把握を効率的に発見するために、問題の構造を活用する効率的なバンドレートスタイルのアルゴリズムBORGESを提案する。
BORGESは任意の汎用的な把握アルゴリズムを任意の把握モード(パラレルジャウ、吸引、マルチフィンガードなど)で補完し、永続的な障害を示すオブジェクトのポリシーを学ぶために使用することができる。
シミュレーション実験によれば、borgesは汎用の把持パイプラインと他の2つのオンライン学習アルゴリズムを大きく上回ることができ、dex-net adversarial と egad! object datasets の46の挑戦的オブジェクトに対して、1000時間以内に最適なポリシーの5%以内にパフォーマンスを達成できる。
最初の物理実験では、実世界での把握の試みが200回に過ぎず、dex-netベースラインよりも45%向上できることが示唆された。
補足資料とビデオはhttps://tinyurl.com/exp-graspingを参照。
関連論文リスト
- Robust compressive tracking via online weighted multiple instance learning [0.6813925418351435]
本稿では,スパース表現と重み付きマルチインスタンス学習(WMIL)アルゴリズムに基づく粗い検索戦略を統合することで,ビジュアルオブジェクト追跡アルゴリズムを提案する。
提案手法は,他のトラッカーと比較して,粗大な探索法によりより複雑度が低く,重要なサンプルの重み付けも可能である。
論文 参考訳(メタデータ) (2024-06-14T10:48:17Z) - Enhancing Digital Hologram Reconstruction Using Reverse-Attention Loss for Untrained Physics-Driven Deep Learning Models with Uncertain Distance [10.788482076164314]
未学習のディープラーニング手法におけるオートフォーカス問題に対処するための先駆的なアプローチを提案する。
提案手法は,競合する手法に対する大幅な再構成性能を示す。
例えば、PSNRでは1dB以下であり、SSIMでは0.002以下である。
論文 参考訳(メタデータ) (2024-01-11T01:30:46Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Planning for Sample Efficient Imitation Learning [52.44953015011569]
現在の模倣アルゴリズムは、高い性能と高環境サンプル効率を同時に達成するのに苦労している。
本研究では,環境内サンプルの効率と性能を同時に達成できる計画型模倣学習手法であるEfficientImitateを提案する。
実験結果から,EIは性能と試料効率の両立を図った。
論文 参考訳(メタデータ) (2022-10-18T05:19:26Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Fast Bayesian Optimization of Needle-in-a-Haystack Problems using
Zooming Memory-Based Initialization [73.96101108943986]
Needle-in-a-Haystack問題は、データセットのサイズに対して最適な条件が極端に不均衡であるときに発生する。
本稿では,従来のベイズ最適化原理に基づくズームメモリに基づく初期化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-26T23:57:41Z) - Reinforcement Learning for Branch-and-Bound Optimisation using
Retrospective Trajectories [72.15369769265398]
機械学習は分岐のための有望なパラダイムとして登場した。
分岐のための単純かつ効果的なRLアプローチであるレトロ分岐を提案する。
我々は現在最先端のRL分岐アルゴリズムを3~5倍に上回り、500の制約と1000の変数を持つMILP上での最高のILメソッドの性能の20%以内である。
論文 参考訳(メタデータ) (2022-05-28T06:08:07Z) - GloCAL: Glocalized Curriculum-Aided Learning of Multiple Tasks with
Application to Robotic Grasping [8.011844542918832]
エージェントが複数の個別タスクを学習するためのカリキュラムを作成するアルゴリズムを提案する。
最高のパフォーマンスのクラスタから、クラスタのグローバルタスク代表が、グローバルポリシーを学ぶために識別される。
また,GloCALアルゴリズムの有効性と効率性を,学習領域における他の手法と比較した。
論文 参考訳(メタデータ) (2022-04-14T09:06:23Z) - A Pragmatic Look at Deep Imitation Learning [0.3626013617212666]
我々は6つの異なる対向的模倣学習アルゴリズムを再実装する。
広く使われている専門的軌跡データセットで評価する。
GAILは、様々なサンプルサイズにわたって、一貫してよく機能する。
論文 参考訳(メタデータ) (2021-08-04T06:33:10Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Accelerating Grasp Exploration by Leveraging Learned Priors [24.94895421569869]
ロボットが新しい物体を把握できることは、eコマースのオーダーフルフィルメントとホームサービスに産業的応用をもたらす。
オンライン体験を用いて、未知の形状の物体を学習するトンプソンサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-11T09:42:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。