論文の概要: Robotic Learning the Sequence of Packing Irregular Objects from Human
Demonstrations
- arxiv url: http://arxiv.org/abs/2210.01645v1
- Date: Tue, 4 Oct 2022 14:44:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 15:46:04.993170
- Title: Robotic Learning the Sequence of Packing Irregular Objects from Human
Demonstrations
- Title(参考訳): 人間の実験から不規則な物体を詰め込む過程を学習するロボット
- Authors: Andr\'e Santos, Atabak Dehban, Jos\'e Santos-Victor
- Abstract要約: 我々は、暗黙的なタスク知識と戦略を抽出し、効率的な空間利用を実現するために、専門家によるデモンストレーションから学ぶ。
BoxEDデータセットを使用してマルコフ連鎖を学習し、与えられたオブジェクトセットのオブジェクトパッキングシーケンスを予測する。
実験結果から,ヒトが生成したシーケンスよりも人間に近い頻度で分類するシーケンス予測を生成することにより,モデルが人のパフォーマンスを上回ることが示唆された。
- 参考スコア(独自算出の注目度): 1.1602089225841632
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We address the unsolved task of robotic bin packing with irregular objects,
such as groceries, where the underlying constraints on object placement and
manipulation, and the diverse objects' physical properties make preprogrammed
strategies unfeasible. Our approach is to learn directly from expert
demonstrations in order to extract implicit task knowledge and strategies to
achieve an efficient space usage, safe object positioning and to generate
human-like behaviors that enhance human-robot trust. We collect and make
available a novel and diverse dataset, BoxED, of box packing demonstrations by
humans in virtual reality. In total, 263 boxes were packed with
supermarket-like objects by 43 participants, yielding 4644 object
manipulations. We use the BoxED dataset to learn a Markov chain to predict the
object packing sequence for a given set of objects and compare it with human
performance. Our experimental results show that the model surpasses human
performance by generating sequence predictions that humans classify as
human-like more frequently than human-generated sequences.
- Abstract(参考訳): 食品などの不規則な物体を詰め込むロボット・ビンの未解決課題に対処する。そこでは,物体の配置と操作に対する基礎的制約,および多様な物体の物理的特性が事前プログラムされた戦略を実現不可能にする。
我々のアプローチは、暗黙のタスク知識と戦略を抽出し、効率的な空間利用、安全なオブジェクト位置決め、人間-ロボット信頼を高める人間のような行動を生成するために、専門家によるデモンストレーションから直接学習することである。
私たちは、バーチャルリアリティーにおける人間の箱詰めデモの、新しくて多様なデータセット、boxedを収集し、利用可能にする。
合計263箱に43人の参加者がスーパーのようなオブジェクトを詰め込み、4644個のオブジェクト操作を行った。
BoxEDデータセットを使用してマルコフ連鎖を学習し、与えられたオブジェクトセットのオブジェクトパッキングシーケンスを予測し、それを人間のパフォーマンスと比較する。
実験結果から,ヒトが生成したシーケンスよりも人間に近い頻度で分類するシーケンス予測を作成した。
関連論文リスト
- Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - MimicGen: A Data Generation System for Scalable Robot Learning using
Human Demonstrations [55.549956643032836]
MimicGenは、少数の人間のデモから大規模でリッチなデータセットを自動的に合成するシステムである。
ロボットエージェントは,この生成したデータセットを模倣学習により効果的に訓練し,長期的・高精度なタスクにおいて高い性能を達成することができることを示す。
論文 参考訳(メタデータ) (2023-10-26T17:17:31Z) - Learning Video-Conditioned Policies for Unseen Manipulation Tasks [83.2240629060453]
ビデオ条件付きポリシー学習は、以前は目に見えないタスクの人間のデモをロボット操作スキルにマッピングする。
我々は,現在のシーン観察と対象課題のビデオから適切なアクションを生成するためのポリシーを学習する。
われわれは,多タスクロボット操作環境の課題と,技術面における性能の面から,そのアプローチを検証した。
論文 参考訳(メタデータ) (2023-05-10T16:25:42Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - DexTransfer: Real World Multi-fingered Dexterous Grasping with Minimal
Human Demonstrations [51.87067543670535]
本研究では,少数の人間によるデモンストレーションを行い,見えない物体のポーズを学習するロボット学習システムを提案する。
我々は,物体の点群を入力として捉え,物体を異なる初期ロボット状態から把握するための連続的な動作を予測する,厳密な把握ポリシーを訓練する。
我々のデータセットから学んだポリシーは、シミュレーションと現実世界の両方で見えないオブジェクトのポーズをうまく一般化することができる。
論文 参考訳(メタデータ) (2022-09-28T17:51:49Z) - Human-like Planning for Reaching in Cluttered Environments [11.55532557594561]
人間は、散らかった環境でオブジェクトに手を伸ばすのに驚くほど適しています。
我々は、人間の高度な操作計画を特定し、これらのスキルをロボットプランナーに転送する。
人間のようなプランナーは、最先端の標準軌道最適化アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-02-28T14:28:50Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。