論文の概要: Visuomotor Mechanical Search: Learning to Retrieve Target Objects in
Clutter
- arxiv url: http://arxiv.org/abs/2008.06073v1
- Date: Thu, 13 Aug 2020 18:23:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 22:45:58.278679
- Title: Visuomotor Mechanical Search: Learning to Retrieve Target Objects in
Clutter
- Title(参考訳): Visuomotor Mechanical Search: クラッタ内のターゲットオブジェクトを検索する学習
- Authors: Andrey Kurenkov, Joseph Taglic, Rohun Kulkarni, Marcus
Dominguez-Kuhne, Animesh Garg, Roberto Mart\'in-Mart\'in, Silvio Savarese
- Abstract要約: 本稿では,教師支援による探索,特権情報による批判,中間レベルの表現を組み合わせた新しい深部RL手順を提案する。
我々のアプローチは、ベースラインやアブレーションよりも高速に学習し、より効率的な解の発見に収束する。
- 参考スコア(独自算出の注目度): 43.668395529368354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When searching for objects in cluttered environments, it is often necessary
to perform complex interactions in order to move occluding objects out of the
way and fully reveal the object of interest and make it graspable. Due to the
complexity of the physics involved and the lack of accurate models of the
clutter, planning and controlling precise predefined interactions with accurate
outcome is extremely hard, when not impossible. In problems where accurate
(forward) models are lacking, Deep Reinforcement Learning (RL) has shown to be
a viable solution to map observations (e.g. images) to good interactions in the
form of close-loop visuomotor policies. However, Deep RL is sample inefficient
and fails when applied directly to the problem of unoccluding objects based on
images. In this work we present a novel Deep RL procedure that combines i)
teacher-aided exploration, ii) a critic with privileged information, and iii)
mid-level representations, resulting in sample efficient and effective learning
for the problem of uncovering a target object occluded by a heap of unknown
objects. Our experiments show that our approach trains faster and converges to
more efficient uncovering solutions than baselines and ablations, and that our
uncovering policies lead to an average improvement in the graspability of the
target object, facilitating downstream retrieval applications.
- Abstract(参考訳): 乱雑な環境でオブジェクトを探索する場合、乱雑なオブジェクトを邪魔から外し、関心のあるオブジェクトを完全に明らかにし、それを把握可能にするために、複雑なインタラクションを行う必要があることが多い。
物理学の複雑さとクラッタの正確なモデルが欠如しているため、正確な結果との正確な事前定義された相互作用を計画し、制御するのは、不可能ではない場合は非常に難しい。
正確な(前方)モデルが欠如している問題において、深層強化学習(英語版)(RL)は、近ループビジュモータポリシーの形で良好な相互作用に観察(例えば画像)をマッピングするための実行可能なソリューションであることが示されている。
しかし、Deep RLはサンプル非効率であり、画像に基づいて対象を除外する問題に直接適用すると失敗する。
本稿では,Deep RLプロシージャと組み合わせた新しいDeep RLプロシージャを提案する。
一 教師の支援による探検
二 特権情報を有する評論家、及び
三 未知のオブジェクトのヒープに閉ざされた対象オブジェクトを明らかにする問題に対して、サンプルを効率的かつ効果的に学習すること。
実験により,提案手法は,ベースラインやアブレーションよりも高速に学習し,より効率的な探索ソリューションに収束することを示し,また,対象オブジェクトの把握性が平均的に向上し,下流検索が容易になることを示す。
関連論文リスト
- Learning Extrinsic Dexterity with Parameterized Manipulation Primitives [8.7221770019454]
我々は、オブジェクトのポーズを変えるために環境を利用する一連のアクションを学習する。
我々のアプローチは、オブジェクトとグリップと環境の間の相互作用を利用してオブジェクトの状態を制御することができる。
拘束されたテーブルトップワークスペースから様々な重量,形状,摩擦特性の箱状物体を選別する手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T21:28:23Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Curious Exploration via Structured World Models Yields Zero-Shot Object
Manipulation [19.840186443344]
そこで本研究では,制御ループに帰納バイアスを組み込む構造的世界モデルを用いて,サンプル効率の高い探索を実現することを提案する。
提案手法は,早期にオブジェクトと対話し始める自由プレイ動作を生成し,時間とともにより複雑な動作を発達させる。
論文 参考訳(メタデータ) (2022-06-22T22:08:50Z) - Towards Optimal Correlational Object Search [25.355936023640506]
相関オブジェクト探索POMDPは相関情報を用いた探索戦略を作成することができる。
我々は,家庭環境の現実的なシミュレータであるAI2-THORと,広く使用されている物体検出器であるYOLOv5を用いて実験を行った。
論文 参考訳(メタデータ) (2021-10-19T14:03:43Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Occlusion-Aware Search for Object Retrieval in Clutter [4.693170687870612]
乱雑な棚から対象物を回収する操作タスクに対処する。
対象物が隠された場合、ロボットはそれを回収するために溝を探索しなければならない。
クローズドループにおけるオクルージョン認識動作を生成するためのデータ駆動型ハイブリッドプランナを提案する。
論文 参考訳(メタデータ) (2020-11-06T13:15:27Z) - Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in a
First-person Simulated 3D Environment [73.9469267445146]
高忠実な3Dシミュレーション環境において、AI2Thorのような一対一のオブジェクトインタラクションタスクは、強化学習エージェントに顕著なサンプル効率の課題をもたらす。
補助的なタスクとして注意的オブジェクトモデルを学ぶことで、監督なしに、ゼロからオブジェクトインタラクションタスクを学習できることが示される。
論文 参考訳(メタデータ) (2020-10-28T19:27:26Z) - Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning [0.0951828574518325]
現在の深層強化学習(RL)アプローチでは、環境に関する最小限の事前知識が組み込まれている。
本稿では,最小限およびタスク固有のオブジェクト表現を迅速に決定するために,オブジェクトのダイナミクスと振る舞いを推論するフレームワークを提案する。
また、オブジェクト表現と標準RLと計画アルゴリズムを用いて、Atariゲームにおけるこのフレームワークの可能性を強調し、既存の深層RLアルゴリズムよりも劇的に高速に学習する。
論文 参考訳(メタデータ) (2020-03-03T08:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。