論文の概要: X-Ray: Mechanical Search for an Occluded Object by Minimizing Support of
Learned Occupancy Distributions
- arxiv url: http://arxiv.org/abs/2004.09039v2
- Date: Sat, 10 Oct 2020 19:44:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 19:04:00.785121
- Title: X-Ray: Mechanical Search for an Occluded Object by Minimizing Support of
Learned Occupancy Distributions
- Title(参考訳): X線:学習職業分布の最小化による咬合物体の機械的探索
- Authors: Michael Danielczuk, Anelia Angelova, Vincent Vanhoucke, Ken Goldberg
- Abstract要約: 本稿では,習熟度分布に基づくX線アルゴリズムを提案する。
X線は、シミュレーションと実環境の両方において、機械的な探索ポリシーの一部として学習された分布のサポートを最小化する。
その結果、X線は82%の時間で対象物を抽出することに成功したため、はるかに効率が良いことが示唆された。
- 参考スコア(独自算出の注目度): 44.39286120613235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For applications in e-commerce, warehouses, healthcare, and home service,
robots are often required to search through heaps of objects to grasp a
specific target object. For mechanical search, we introduce X-Ray, an algorithm
based on learned occupancy distributions. We train a neural network using a
synthetic dataset of RGBD heap images labeled for a set of standard bounding
box targets with varying aspect ratios. X-Ray minimizes support of the learned
distribution as part of a mechanical search policy in both simulated and real
environments. We benchmark these policies against two baseline policies on
1,000 heaps of 15 objects in simulation where the target object is partially or
fully occluded. Results suggest that X-Ray is significantly more efficient, as
it succeeds in extracting the target object 82% of the time, 15% more often
than the best-performing baseline. Experiments on an ABB YuMi robot with 20
heaps of 25 household objects suggest that the learned policy transfers easily
to a physical system, where it outperforms baseline policies by 15% in success
rate with 17% fewer actions. Datasets, videos, and experiments are available at
https://sites.google.com/berkeley.edu/x-ray.
- Abstract(参考訳): 電子商取引、倉庫、医療、ホームサービスのアプリケーションの場合、ロボットは特定の対象物を把握するために、オブジェクトのヒープを探索する必要があることが多い。
メカニカルサーチでは,習熟度分布に基づくアルゴリズムであるX線を導入する。
我々は、様々なアスペクト比の標準バウンディングボックスターゲットにラベル付けされたrgbdヒープイメージの合成データセットを使用してニューラルネットワークをトレーニングする。
x線はシミュレーション環境と実環境の両方において機械探索ポリシーの一部として学習分布のサポートを最小化する。
対象オブジェクトが部分的にあるいは完全に隠蔽されているシミュレーションにおいて、1000ヒープの15オブジェクトに対して2つのベースラインポリシーに対してこれらのポリシーをベンチマークする。
その結果、X線は目標対象物を82%抽出するのに成功し、最も性能の良いベースラインよりも15%効率が良いことが示唆された。
ABB YuMiロボットの20ヒープの25の家庭用オブジェクトによる実験では、学習されたポリシーが物理システムに容易に移行し、成功率15%、アクション17%の基準ポリシーを上回ることが示唆された。
データセット、ビデオ、実験はhttps://sites.google.com/berkeley.edu/x-rayで利用可能である。
関連論文リスト
- OptiGrasp: Optimized Grasp Pose Detection Using RGB Images for Warehouse Picking Robots [27.586777997464644]
倉庫環境では、ロボットはさまざまなオブジェクトを管理するために堅牢なピッキング機能を必要とする。
基礎モデルを活用する革新的な手法を提案し,RGB画像のみを用いた吸引把握を向上する。
我々のネットワークは実世界のアプリケーションで82.3%の成功率を達成した。
論文 参考訳(メタデータ) (2024-09-29T00:20:52Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - HIQL: Offline Goal-Conditioned RL with Latent States as Actions [81.67963770528753]
オフラインデータからゴール条件付きRLの階層的アルゴリズムを提案する。
この階層的な分解によって、推定値関数のノイズに頑健になることを示す。
提案手法は,従来の手法を巧みに操り,高次元画像観察にスケールできるとともに,アクションフリーなデータを容易に利用することができる。
論文 参考訳(メタデータ) (2023-07-22T00:17:36Z) - RREx-BoT: Remote Referring Expressions with a Bag of Tricks [19.036557405184656]
本研究では,未観測環境における物体の探索に視覚言語スコアリングモデルを用いる方法を示す。
私たちは、我々のモデルを現実世界のTurtleBotプラットフォーム上でデモし、このアプローチの単純さと有用性を強調します。
本分析では,3次元座標と文脈の利用から,視覚言語モデルから大規模3次元検索空間への一般化に至るまで,この課題を達成する上で不可欠な「トリックの袋」を概説する。
論文 参考訳(メタデータ) (2023-01-30T02:19:19Z) - Object Detection Using Sim2Real Domain Randomization for Robotic
Applications [0.0]
オブジェクト検出のための領域ランダム化に基づくSIM2real Transfer Learning法を提案する。
最先端の畳み込みニューラルネットワークであるYOLOv4は、さまざまな種類の産業オブジェクトを検出するために訓練されている。
我々のソリューションは、トレーニングに1つの実像のみを使用することで、類似したオブジェクトのクラスを確実に区別できるため、産業ニーズにマッチする。
論文 参考訳(メタデータ) (2022-08-08T14:16:45Z) - Mechanical Search on Shelves using a Novel "Bluction" Tool [39.44966150696158]
ストレージ効率は可視性とアクセシビリティを低下させる。
薄型押出刃と吸込カップグリップを組み合わせた新しい吹出し工具を提案する。
吸引握り動作を用いることで、プッシュオンリーのポリシーを26%、物理的環境を67%向上させることができる。
論文 参考訳(メタデータ) (2022-01-22T05:47:30Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Accelerating Grasp Exploration by Leveraging Learned Priors [24.94895421569869]
ロボットが新しい物体を把握できることは、eコマースのオーダーフルフィルメントとホームサービスに産業的応用をもたらす。
オンライン体験を用いて、未知の形状の物体を学習するトンプソンサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-11T09:42:56Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。