論文の概要: Non-Markov Policies to Reduce Sequential Failures in Robot Bin Picking
- arxiv url: http://arxiv.org/abs/2007.10420v1
- Date: Mon, 20 Jul 2020 19:20:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 14:25:05.485873
- Title: Non-Markov Policies to Reduce Sequential Failures in Robot Bin Picking
- Title(参考訳): ロボットビンピッキングにおけるシーケンシャル障害を軽減する非マルコフポリシー
- Authors: Kate Sanders, Michael Danielczuk, Jeffrey Mahler, Ajay Tanwani, Ken
Goldberg
- Abstract要約: 本稿では,新しい分類法に基づく「逐次的故障対象」(SFO)の分類について検討する。
我々は過去の障害の記憶を取り入れた3つの非マルコフ選択ポリシーを提案し、その後の行動を修正する。
- 参考スコア(独自算出の注目度): 20.582264188020527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A new generation of automated bin picking systems using deep learning is
evolving to support increasing demand for e-commerce. To accommodate a wide
variety of products, many automated systems include multiple gripper types
and/or tool changers. However, for some objects, sequential grasp failures are
common: when a computed grasp fails to lift and remove the object, the bin is
often left unchanged; as the sensor input is consistent, the system retries the
same grasp over and over, resulting in a significant reduction in mean
successful picks per hour (MPPH). Based on an empirical study of sequential
failures, we characterize a class of "sequential failure objects" (SFOs) --
objects prone to sequential failures based on a novel taxonomy. We then propose
three non-Markov picking policies that incorporate memory of past failures to
modify subsequent actions. Simulation experiments on SFO models and the EGAD
dataset suggest that the non-Markov policies significantly outperform the
Markov policy in terms of the sequential failure rate and MPPH. In physical
experiments on 50 heaps of 12 SFOs the most effective Non-Markov policy
increased MPPH over the Dex-Net Markov policy by 107%.
- Abstract(参考訳): ディープラーニングを用いた新しい世代の自動ビンピックシステムは、電子商取引の需要増加をサポートするために進化している。
幅広い製品に対応するため、多くの自動化システムには複数のグリッパータイプやツールチェンジャーが含まれる。
しかし、いくつかの物体では、連続的な把持の失敗が一般的であり、計算された把持が物体を持ち上げて取り外すのに失敗した場合、ビンはそのまま残されることが多く、センサ入力が一貫しているため、システムは同じ把持を何度も繰り返し、結果として平均ピック毎時間(mpph)が大幅に減少する。
逐次的障害に関する実証的研究に基づき、新しい分類法に基づく「逐次的障害オブジェクト」(SFO)のクラスを特徴付ける。
次に,過去の失敗の記憶を組み込んだ3つの非マルコフ選択ポリシーを提案する。
SFOモデルとEGADデータセットのシミュレーション実験により、非マルコフポリシーは逐次故障率とMPPHの点でマルコフポリシーを著しく上回っていることが示唆された。
12個のSFOの50ヒープの物理実験では、最も効果的な非マルコフ政策により、デックスネットマルコフ政策よりもMPPHが107%増加した。
関連論文リスト
- Conformal Prediction via Regression-as-Classification [15.746085775084238]
回帰を分類問題に変換し、分類にCPを用いて回帰のCP集合を得る。
多くのベンチマークにおける実証的な結果は、この単純なアプローチが、多くの実践的な問題に対して驚くほど良い結果をもたらすことを示している。
論文 参考訳(メタデータ) (2024-04-12T00:21:30Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - Deep Imbalanced Regression via Hierarchical Classification Adjustment [50.19438850112964]
コンピュータビジョンにおける回帰タスクは、しばしば、対象空間をクラスに定量化することで分類される。
トレーニングサンプルの大多数は目標値の先頭にあるが、少数のサンプルは通常より広い尾幅に分布する。
不均衡回帰タスクを解くために階層型分類器を構築することを提案する。
不均衡回帰のための新しい階層型分類調整(HCA)は,3つのタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2023-10-26T04:54:39Z) - Semi-Supervised Deep Regression with Uncertainty Consistency and
Variational Model Ensembling via Bayesian Neural Networks [31.67508478764597]
我々は,半教師付き回帰,すなわち不確実連続変分モデル組立(UCVME)に対する新しいアプローチを提案する。
整合性損失は不確実性評価を著しく改善し,不整合回帰の下では,高品質な擬似ラベルをより重要視することができる。
実験の結果,本手法は様々なタスクにおける最先端の代替手段よりも優れており,フルラベルを用いた教師付き手法と競合する可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-15T10:40:51Z) - Corruption-tolerant Algorithms for Generalized Linear Models [4.127284659744835]
SVAM(Sequential Variance-Altered MLE)は、汎用線形モデルを学ぶための統一的なフレームワークである。
SVAMは、独立した関心を持つ可能性のある、新しい分散還元技術に基づいている。
論文 参考訳(メタデータ) (2022-12-11T07:08:02Z) - A quantum learning approach based on Hidden Markov Models for failure
scenarios generation [0.6423239719448167]
生成モデルの作成にはHidden Quantum Markov Models(HQMM)を使用します。
量子的アプローチが古典的アプローチよりも優れた結果をもたらすことを示す。
システムの確率的かつ予測不可能な障害シナリオを特定するための戦略を提供します。
論文 参考訳(メタデータ) (2022-03-30T07:27:23Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - NILM as a regression versus classification problem: the importance of
thresholding [0.0]
非侵入負荷モニタリング(Non-Intrusive Load Monitoring, NILM)は、集積電力負荷を知ることで家庭内家電の状況や消費を予測することを目的としている。
本稿では、回帰問題と分類問題の両方に基づいて、ディープラーニングの最先端アーキテクチャの性能を解析する。
論文 参考訳(メタデータ) (2020-10-28T14:17:09Z) - Transferable, Controllable, and Inconspicuous Adversarial Attacks on
Person Re-identification With Deep Mis-Ranking [83.48804199140758]
システム出力のランキングを乱す学習とミスランクの定式化を提案する。
また,新たなマルチステージネットワークアーキテクチャを開発することで,バックボックス攻撃を行う。
そこで本手法では, 異なるマルチショットサンプリングにより, 悪意のある画素数を制御することができる。
論文 参考訳(メタデータ) (2020-04-08T18:48:29Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。