論文の概要: Multi-Object Grasping in the Plane
- arxiv url: http://arxiv.org/abs/2206.00229v1
- Date: Wed, 1 Jun 2022 04:40:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 03:47:09.210814
- Title: Multi-Object Grasping in the Plane
- Title(参考訳): 平面における多物体把持
- Authors: Wisdom C. Agboh, Jeffrey Ichnowski, Ken Goldberg, Mehmet R. Dogar
- Abstract要約: つかむ前に複数のオブジェクトをまとめて押すマルチオブジェクトプッシュグラスプについて検討する。
単目的と多目的の両方のグリップを用いて対象を選別する選別アルゴリズムを提案する。
身体的把握実験では, 単目的ピッキングベースラインと比較して, 多目的グリップシステムは13.6%, 59.9%の高速化を実現している。
- 参考スコア(独自算出の注目度): 25.24826595643838
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem where multiple rigid convex polygonal objects rest in
randomly placed positions and orientations on a planar surface visible from an
overhead camera. The objective is to efficiently grasp and transport all
objects into a bin. Specifically, we explore multi-object push-grasps where
multiple objects are pushed together before the grasp can occur. We provide
necessary conditions for multi-object push-grasps and apply these to filter
inadmissible grasps in a novel multi-object grasp planner. We find that our
planner is 19 times faster than a Mujoco simulator baseline. We also propose a
picking algorithm that uses both single- and multi-object grasps to pick
objects. In physical grasping experiments, compared to a single-object picking
baseline, we find that the multi-object grasping system achieves 13.6% higher
grasp success and is 59.9% faster. See
https://sites.google.com/view/multi-object-grasping for videos, code, and data.
- Abstract(参考訳): 本研究では,複数の剛体凸多角形物体が,頭上カメラから見える平面面上にランダムに配置された位置と向きに静止する問題を考える。
目的は、すべてのオブジェクトを効率的に把握し、ビンに輸送することである。
具体的には、つかむ前に複数のオブジェクトをまとめて押すマルチオブジェクトプッシュグラスプについて検討する。
複数対象のプッシュグラスプに必要な条件を提供し、これらを新規な多対象のグリッププランナにおける不許容グリップのフィルタに適用する。
私たちのプランナーは、mujocoシミュレータのベースラインより19倍速いことが分かりました。
また,単一物体と複数物体の把持を併用して物体を選抜する選抜アルゴリズムを提案する。
身体的把握実験では, 単目的ピッキングベースラインと比較して, 多目的グリップシステムは13.6%, 59.9%の高速化を実現している。
ビデオ、コード、データのhttps://sites.google.com/view/multi-object-graspingを参照。
関連論文リスト
- CVAM-Pose: Conditional Variational Autoencoder for Multi-Object Monocular Pose Estimation [3.5379836919221566]
剛体物体のポーズを推定することはコンピュータビジョンの基本的な問題の一つである。
本稿では,多目的単分子ポーズ推定のための新しいアプローチCVAM-Poseを提案する。
論文 参考訳(メタデータ) (2024-10-11T17:26:27Z) - Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.00828999360765]
本稿では,一般的な物体をロボットでつかむという課題に対処する。
提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。
各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。
モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文 参考訳(メタデータ) (2024-07-22T16:22:28Z) - Beyond SOT: Tracking Multiple Generic Objects at Once [141.36900362724975]
ジェネリックオブジェクト追跡(ジェネリックオブジェクト追跡、英: Generic Object Tracking、GOT)は、ビデオの最初のフレームでボックスをバウンディングすることによって指定されたターゲットオブジェクトを追跡する問題である。
大規模GOTベンチマークであるLaGOTを導入し,複数のアノテート対象オブジェクトをシーケンス毎に含む。
提案手法は単一オブジェクトのGOTデータセットに対して高い競合性を実現し,TrackingNet上での新たな技術状態が84.4%の成功率で設定されている。
論文 参考訳(メタデータ) (2022-12-22T17:59:19Z) - Learning to Efficiently Plan Robust Frictional Multi-Object Grasps [21.214123773086634]
本稿では,ある対象群に対する潜在的なつかみ数を増やすために,摩擦を導入する。
実例を用いてニューラルネットワークをトレーニングし、堅牢なマルチオブジェクトグリップを計画する。
物理実験では、成功率は13.7%増加し、1時間あたりのピックは1.6倍増加し、把握計画時間の6.3倍減少している。
論文 参考訳(メタデータ) (2022-10-13T23:51:22Z) - A Simple Baseline for Multi-Camera 3D Object Detection [94.63944826540491]
周囲のカメラで3Dオブジェクトを検出することは、自動運転にとって有望な方向だ。
マルチカメラオブジェクト検出のための簡易ベースラインであるSimMODを提案する。
我々は, nuScenes の3次元オブジェクト検出ベンチマークにおいて, SimMOD の有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-08-22T03:38:01Z) - Negative Frames Matter in Egocentric Visual Query 2D Localization [119.23191388798921]
最近リリースされたEgo4Dデータセットとベンチマークは、一人称視覚知覚データを大幅にスケールし、多様化している。
Visual Queries 2Dローカライゼーションタスクは、1対1の視点で記録された過去に存在するオブジェクトを検索することを目的としている。
本研究は,Epsodic Memoryベンチマークで導入された3段階ベースラインに基づく。
論文 参考訳(メタデータ) (2022-08-03T09:54:51Z) - Associating Objects with Transformers for Video Object Segmentation [74.51719591192787]
本稿では,複数のオブジェクトを一様に一致・復号化するためのAssociating Objects with Transformers (AOT)アプローチを提案する。
AOTは複数のターゲットを同一の高次元埋め込み空間に関連付けるための識別機構を用いる。
第3回大規模ビデオオブジェクトチャレンジでは1位にランクインした。
論文 参考訳(メタデータ) (2021-06-04T17:59:57Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - MVLidarNet: Real-Time Multi-Class Scene Understanding for Autonomous
Driving Using Multiple Views [60.538802124885414]
マルチビューLidarNet(MVLidarNet)は,多層物体検出とドライビング空間分割のための2段階のディープニューラルネットワークである。
MVLidarNetは、単一のLiDARスキャンを入力として、乾燥可能な空間を同時に決定しながら、オブジェクトを検出し、分類することができる。
我々は、KITTIとはるかに大きな内部データセットの両方で結果を示し、その方法が桁違いにスケールできることを実証する。
論文 参考訳(メタデータ) (2020-06-09T21:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。