Fugu-MT 論文翻訳(概要): Uncertainty-driven Exploration Strategies for Online Grasp Learning

論文の概要: Uncertainty-driven Exploration Strategies for Online Grasp Learning

arxiv url: http://arxiv.org/abs/2309.12038v2
Date: Wed, 24 Apr 2024 11:40:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-26 23:57:24.283608
Title: Uncertainty-driven Exploration Strategies for Online Grasp Learning
Title（参考訳）: オンライングラフ学習のための不確実性駆動探索手法
Authors: Yitian Shi, Philipp Schillinger, Miroslav Gabriel, Alexander Qualmann, Zohar Feldman, Hanna Ziesche, Ngo Anh Vien,
Abstract要約: 本稿では,ロボットビンピッキングのための把握予測のオンライン学習のための不確実性に基づくアプローチを提案する。具体的には、効果的な探索戦略を持つオンライン学習アルゴリズムは、目に見えない環境設定への適応性を著しく向上させることができる。
参考スコア（独自算出の注目度）: 43.88491290121489
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Existing grasp prediction approaches are mostly based on offline learning, while, ignoring the exploratory grasp learning during online adaptation to new picking scenarios, i.e., objects that are unseen or out-of-domain (OOD), camera and bin settings, etc. In this paper, we present an uncertainty-based approach for online learning of grasp predictions for robotic bin picking. Specifically, the online learning algorithm with an effective exploration strategy can significantly improve its adaptation performance to unseen environment settings. To this end, we first propose to formulate online grasp learning as an RL problem that will allow us to adapt both grasp reward prediction and grasp poses. We propose various uncertainty estimation schemes based on Bayesian uncertainty quantification and distributional ensembles. We carry out evaluations on real-world bin picking scenes of varying difficulty. The objects in the bin have various challenging physical and perceptual characteristics that can be characterized by semi- or total transparency, and irregular or curved surfaces. The results of our experiments demonstrate a notable improvement of grasp performance in comparison to conventional online learning methods which incorporate only naive exploration strategies. Video: https://youtu.be/fPKOrjC2QrU
Abstract（参考訳）: 既存の把握予測アプローチは、主にオフライン学習に基づいており、オンライン適応中の探索的把握学習を、新しいピックシナリオ、すなわち、目に見えないオブジェクトや、ドメイン外(OOD)、カメラ、ビンの設定に無視する。本稿では,ロボットビンピッキングにおける把握予測のオンライン学習における不確実性に基づくアプローチを提案する。具体的には、効果的な探索戦略を持つオンライン学習アルゴリズムは、目に見えない環境設定への適応性を著しく向上させることができる。この目的のために,まずオンライン学習をRL問題として定式化することを提案する。ベイズの不確実性定量化と分布アンサンブルに基づく様々な不確実性推定手法を提案する。我々は,様々な難易度のある実世界のビンピッキングシーンの評価を行う。ビン内の物体は、半透明または全透明、不規則または湾曲した表面によって特徴づけられる様々な困難な物理的特徴と知覚的特徴を有する。実験の結果, ナイーブな探索戦略のみを取り入れた従来のオンライン学習手法と比較して, 把握能力の顕著な向上が示された。ビデオ:https://youtu.be/fPKOrjC2QrU

関連論文リスト

Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [93.58897637077001]
本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文参考訳（メタデータ） (2025-03-11T13:50:22Z)
Active Exploration via Autoregressive Generation of Missing Data [11.713451719120707]
自己回帰シーケンスモデルからのトレーニングと生成の問題として,オンライン意思決定において不確実な定量化と探索を行う。われわれのアプローチは、適切な行動選択によって明らかになるであろう将来の成果の欠如から生じる不確実性に頼っている。
論文参考訳（メタデータ） (2024-05-29T19:24:44Z)
Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp Learning in Robotic Bin Picking [47.4409816260196]
SSL-ConvSACは、半教師付き学習と強化学習を組み合わせて、オンライングリップラーニングを行う。実機7-DoFのフランカ・エミカロボットアームに吸引グリップを装着することで,ビンピッキングタスクにおけるオンライングリップ学習を改善することを実証する。
論文参考訳（メタデータ） (2024-03-04T21:41:27Z)
Discounted Adaptive Online Learning: Towards Better Regularization [5.5899168074961265]
敵対的非定常環境におけるオンライン学習について検討する。適応的アルゴリズム(例:Optimal)を提案し,適応的でないベースラインを広く改良する。また、(Gibbs and Candes, 2021)スタイルのオンライン共形予測問題についても検討する。
論文参考訳（メタデータ） (2024-02-05T04:29:39Z)
EANet: Expert Attention Network for Online Trajectory Prediction [5.600280639034753]
Expert Attention Networkは、軌道予測のための完全なオンライン学習フレームワークである。我々は,ネットワーク層の深さの異なる重みを調整し,勾配問題によるモデル更新が遅いことを回避し,専門家の注意を喚起する。さらに,シナリオ変化に敏感な短期動作トレンドカーネル関数を提案する。
論文参考訳（メタデータ） (2023-09-11T07:09:40Z)
Smoothed Online Learning for Prediction in Piecewise Affine Systems [43.64498536409903]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文参考訳（メタデータ） (2023-01-26T15:54:14Z)
Continual Predictive Learning from Videos [100.27176974654559]
本稿では,ビデオ予測の文脈において,新たな連続学習問題について検討する。本稿では,連続予測学習(Continuousal predictive Learning, CPL)アプローチを提案する。我々はRoboNetとKTHに基づく2つの新しいベンチマークを構築し、異なるタスクが異なる物理ロボット環境や人間の行動に対応するようにした。
論文参考訳（メタデータ） (2022-04-12T08:32:26Z)
Recursive Least-Squares Estimator-Aided Online Learning for Visual Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文参考訳（メタデータ） (2021-12-28T06:51:18Z)
Exploring Bayesian Deep Learning for Urgent Instructor Intervention Need in MOOC Forums [58.221459787471254]
大規模なオープンオンラインコース(MOOC)は、その柔軟性のおかげで、eラーニングの一般的な選択肢となっている。多くの学習者とその多様な背景から、リアルタイムサポートの提供は課税されている。 MOOCインストラクターの大量の投稿と高い作業負荷により、インストラクターが介入を必要とするすべての学習者を識別できる可能性は低いです。本稿では,モンテカルロドロップアウトと変分推論という2つの手法を用いて,学習者によるテキスト投稿のベイジアン深層学習を初めて検討する。
論文参考訳（メタデータ） (2021-04-26T15:12:13Z)
Low-Regret Active learning [64.36270166907788]
トレーニングに最も有用なラベル付きデータポイントを識別するオンライン学習アルゴリズムを開発した。私たちの仕事の中心は、予測可能な(簡単な)インスタンスの低い後悔を達成するために調整された睡眠専門家のための効率的なアルゴリズムです。
論文参考訳（メタデータ） (2021-04-06T22:53:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。