論文の概要: Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp
Learning in Robotic Bin Picking
- arxiv url: http://arxiv.org/abs/2403.02495v1
- Date: Mon, 4 Mar 2024 21:41:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 17:00:22.970397
- Title: Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp
Learning in Robotic Bin Picking
- Title(参考訳): ロボットビンピッキングにおけるオンライングラフ学習のための擬似ラベルと文脈学習
- Authors: Huy Le, Philipp Schillinger, Miroslav Gabriel, Alexander Qualmann, Ngo
Anh Vien
- Abstract要約: SSL-ConvSACは、半教師付き学習と強化学習を組み合わせて、オンライングリップラーニングを行う。
実機7-DoFのフランカ・エミカロボットアームに吸引グリップを装着することで,ビンピッキングタスクにおけるオンライングリップ学習を改善することを実証する。
- 参考スコア(独自算出の注目度): 47.4409816260196
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The prevailing grasp prediction methods predominantly rely on offline
learning, overlooking the dynamic grasp learning that occurs during real-time
adaptation to novel picking scenarios. These scenarios may involve previously
unseen objects, variations in camera perspectives, and bin configurations,
among other factors. In this paper, we introduce a novel approach, SSL-ConvSAC,
that combines semi-supervised learning and reinforcement learning for online
grasp learning. By treating pixels with reward feedback as labeled data and
others as unlabeled, it efficiently exploits unlabeled data to enhance
learning. In addition, we address the imbalance between labeled and unlabeled
data by proposing a contextual curriculum-based method. We ablate the proposed
approach on real-world evaluation data and demonstrate promise for improving
online grasp learning on bin picking tasks using a physical 7-DoF Franka Emika
robot arm with a suction gripper. Video: https://youtu.be/OAro5pg8I9U
- Abstract(参考訳): 一般的な把握予測法は主にオフライン学習に依存しており、新しいピッキングシナリオへのリアルタイム適応中に発生する動的把握学習を見越す。
これらのシナリオには、以前は目に見えないオブジェクト、カメラの視点の変化、ビンの設定などが含まれる。
本稿では,オンライン学習における半教師付き学習と強化学習を組み合わせた新しいアプローチであるSSL-ConvSACを提案する。
ラベル付きデータ等として報奨フィードバック付き画素を扱い、ラベルなしデータを効率的に活用して学習を促進する。
また,文脈的カリキュラムに基づく手法を提案することで,ラベル付きデータとラベルなしデータの不均衡を解消する。
提案手法を実世界評価データに適用し,実機7-DoFのフランカ・エミカロボットアームと吸引グリップを用いて,ビンピック作業におけるオンライングリップ学習を改善することを約束する。
ビデオ: https://youtu.be/OAro5pg8I9U
関連論文リスト
- Any-point Trajectory Modeling for Policy Learning [64.23861308947852]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Uncertainty-driven Exploration Strategies for Online Grasp Learning [43.88491290121489]
本稿では,ロボットビンピッキングのための把握予測のオンライン学習のための不確実性に基づくアプローチを提案する。
具体的には、効果的な探索戦略を持つオンライン学習アルゴリズムは、目に見えない環境設定への適応性を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-09-21T13:06:03Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - Brief Introduction to Contrastive Learning Pretext Tasks for Visual
Representation [0.0]
教師なし学習手法のサブセットであるコントラスト学習を導入する。
対照的な学習の目的は、互いに近くにある同じサンプルから強化されたサンプルを埋め込んで、そうでないサンプルを押し下げることである。
我々は、最近公開されたコントラスト学習の戦略をいくつか提示し、視覚表現のためのプレテキストタスクに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-06T18:54:10Z) - An Exploration of Active Learning for Affective Digital Phenotyping [4.790279027864381]
アクティブラーニング(英: Active Learning)は、アルゴリズムを用いてラベルに対するデータポイントの有用なサブセットを計算的に選択するパラダイムである。
自然主義的コンピュータビジョン感情データ(特に異種で複雑なデータ空間)のアクティブラーニングについて検討する。
ゲームプレイ中に生成された情報を用いた能動的学習は,同一数のラベル付きフレームのランダム選択よりも若干優れていた。
論文 参考訳(メタデータ) (2022-04-05T01:01:32Z) - Online Continual Learning on a Contaminated Data Stream with Blurry Task
Boundaries [17.43350151320054]
大量の連続学習(CL)手法は、クリーンなラベルを持つデータストリームを前提としており、ノイズの多いデータストリームの下でのオンライン学習シナリオはまだ探索されていない。
我々は、既存のCLメソッドが苦労しているラベル付きぼやけたデータストリームからオンライン学習のより実践的なCLタスク設定について検討する。
本稿では,ラベルノイズを意識した多様なサンプリングと,半教師付き学習による頑健な学習の統一的アプローチにより,メモリの管理と利用を行う新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:52:45Z) - Learning to Predict Gradients for Semi-Supervised Continual Learning [36.715712711431856]
マシンインテリジェンスの主な課題は、以前獲得した知識を忘れずに、新しい視覚概念を学習することだ。
既存の教師付き連続学習と人間のような知性の間にはギャップがあり、人間はラベル付きデータとラベルなしデータの両方から学ぶことができる。
我々は,既存の連続学習モデルに汎用的に適用可能な,半教師付き連続学習法を定式化した。
論文 参考訳(メタデータ) (2022-01-23T06:45:47Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Privileged Knowledge Distillation for Online Action Detection [114.5213840651675]
リアルタイム予測タスクに対処するフレーム単位のラベル付けタスクとして,ビデオ中のオンラインアクション検出(OAD)を提案する。
本稿では,トレーニング段階においてのみ観測可能な未来のフレームを特権情報の一種とみなすオンライン行動検出のための,新たな学習支援型フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-18T08:52:15Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。