論文の概要: Uncertainty-driven Exploration Strategies for Online Grasp Learning
- arxiv url: http://arxiv.org/abs/2309.12038v1
- Date: Thu, 21 Sep 2023 13:06:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 15:19:00.346178
- Title: Uncertainty-driven Exploration Strategies for Online Grasp Learning
- Title(参考訳): 不確実性に基づくオンライン理解学習のための探索戦略
- Authors: Yitian Shi, Philipp Schillinger, Miroslav Gabriel, Alexander Kuss,
Zohar Feldman, Hanna Ziesche, Ngo Anh Vien
- Abstract要約: 本稿では,ロボットビンピックの把握予測を原則的にオンライン学習する手法を提案する。
具体的には、効果的な探索戦略を持つオンライン学習アルゴリズムは、目に見えない環境設定への適応性を著しく向上させることができる。
ベイジアン不確実性定量化と分布アンサンブルに基づく様々な不確実性推定手法を提案する。
- 参考スコア(独自算出の注目度): 45.775045146934254
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing grasp prediction approaches are mostly based on offline learning,
while, ignored the exploratory grasp learning during online adaptation to new
picking scenarios, i.e., unseen object portfolio, camera and bin settings etc.
In this paper, we present a novel method for online learning of grasp
predictions for robotic bin picking in a principled way. Existing grasp
prediction approaches are mostly based on offline learning, while, ignored the
exploratory grasp learning during online adaptation to new picking scenarios,
i.e., unseen object portfolio, camera and bin settings etc. In this paper, we
present a novel method for online learning of grasp predictions for robotic bin
picking in a principled way. Specifically, the online learning algorithm with
an effective exploration strategy can significantly improve its adaptation
performance to unseen environment settings. To this end, we first propose to
formulate online grasp learning as a RL problem that will allow to adapt both
grasp reward prediction and grasp poses. We propose various uncertainty
estimation schemes based on Bayesian Uncertainty Quantification and
Distributional Ensembles. We carry out evaluations on real-world bin picking
scenes of varying difficulty. The objects in the bin have various challenging
physical and perceptual characteristics that can be characterized by semi- or
total transparency, and irregular or curved surfaces. The results of our
experiments demonstrate a notable improvement in the suggested approach
compared to conventional online learning methods which incorporate only naive
exploration strategies.
- Abstract(参考訳): 既存の把握予測アプローチは、主にオフライン学習に基づいており、オンライン適応中の探索的把握学習を新しいピッキングシナリオ、すなわち見えないオブジェクトポートフォリオ、カメラとビンの設定に無視する。
本稿では,ロボット・ビン・ピックの把握予測を原則的にオンライン学習する手法を提案する。
既存の把握予測アプローチは、主にオフライン学習に基づいており、オンライン適応中の探索的把握学習を新しいピッキングシナリオ、すなわち見えないオブジェクトポートフォリオ、カメラとビンの設定に無視する。
本稿では,ロボット・ビン・ピックの把握予測を原則的にオンライン学習する手法を提案する。
特に、効果的な探索戦略を持つオンライン学習アルゴリズムは、見えない環境設定への適応性能を大幅に向上させることができる。
そこで本研究では,まず,把握報酬予測と把持ポーズの両方を適応できるrl問題として,オンライン把握学習を定式化することを提案する。
ベイジアン不確実性定量化と分布アンサンブルに基づく様々な不確実性推定手法を提案する。
様々な難易度を実世界のビンピッキングシーンで評価する。
ビン内の物体は、半透明または全透明、不規則または湾曲した表面によって特徴づけられる様々な困難な物理的特徴と知覚的特徴を有する。
実験の結果,提案手法は従来のオンライン学習手法に比べて,単純な探索戦略のみを取り入れた手法に比べて顕著に改善された。
関連論文リスト
- Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp
Learning in Robotic Bin Picking [47.4409816260196]
SSL-ConvSACは、半教師付き学習と強化学習を組み合わせて、オンライングリップラーニングを行う。
実機7-DoFのフランカ・エミカロボットアームに吸引グリップを装着することで,ビンピッキングタスクにおけるオンライングリップ学習を改善することを実証する。
論文 参考訳(メタデータ) (2024-03-04T21:41:27Z) - EANet: Expert Attention Network for Online Trajectory Prediction [5.600280639034753]
Expert Attention Networkは、軌道予測のための完全なオンライン学習フレームワークである。
我々は,ネットワーク層の深さの異なる重みを調整し,勾配問題によるモデル更新が遅いことを回避し,専門家の注意を喚起する。
さらに,シナリオ変化に敏感な短期動作トレンドカーネル関数を提案する。
論文 参考訳(メタデータ) (2023-09-11T07:09:40Z) - Continual Learning with Pretrained Backbones by Tuning in the Input
Space [44.97953547553997]
ディープラーニングモデルを非定常環境に適用することの本質的な困難さは、ニューラルネットワークの実際のタスクへの適用性を制限している。
ネットワークの事前学習部分の更新を回避し、通常の分類ヘッドだけでなく、新たに導入した学習可能なパラメータのセットも学習することで、微調整手順をより効果的にするための新しい戦略を提案する。
論文 参考訳(メタデータ) (2023-06-05T15:11:59Z) - Smoothed Online Learning for Prediction in Piecewise Affine Systems [54.98643421343919]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-01-26T15:54:14Z) - Continual Predictive Learning from Videos [100.27176974654559]
本稿では,ビデオ予測の文脈において,新たな連続学習問題について検討する。
本稿では,連続予測学習(Continuousal predictive Learning, CPL)アプローチを提案する。
我々はRoboNetとKTHに基づく2つの新しいベンチマークを構築し、異なるタスクが異なる物理ロボット環境や人間の行動に対応するようにした。
論文 参考訳(メタデータ) (2022-04-12T08:32:26Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。