論文の概要: Distributional Instance Segmentation: Modeling Uncertainty and High
Confidence Predictions with Latent-MaskRCNN
- arxiv url: http://arxiv.org/abs/2305.01910v1
- Date: Wed, 3 May 2023 05:57:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 15:51:06.166420
- Title: Distributional Instance Segmentation: Modeling Uncertainty and High
Confidence Predictions with Latent-MaskRCNN
- Title(参考訳): 分散インスタンスセグメンテーション:潜在MaskRCNNによる不確実性と信頼性予測のモデル化
- Authors: YuXuan Liu, Nikhil Mishra, Pieter Abbeel, Xi Chen
- Abstract要約: 本稿では,潜在符号を用いた分散インスタンス分割モデルのクラスについて検討する。
ロボットピッキングへの応用として,高い精度を実現するための信頼性マスク手法を提案する。
本手法は,新たにリリースした曖昧なシーンのデータセットを含め,ロボットシステムにおける致命的なエラーを著しく低減できることを示す。
- 参考スコア(独自算出の注目度): 77.0623472106488
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Object recognition and instance segmentation are fundamental skills in any
robotic or autonomous system. Existing state-of-the-art methods are often
unable to capture meaningful uncertainty in challenging or ambiguous scenes,
and as such can cause critical errors in high-performance applications. In this
paper, we explore a class of distributional instance segmentation models using
latent codes that can model uncertainty over plausible hypotheses of object
masks. For robotic picking applications, we propose a confidence mask method to
achieve the high precision necessary in industrial use cases. We show that our
method can significantly reduce critical errors in robotic systems, including
our newly released dataset of ambiguous scenes in a robotic application. On a
real-world apparel-picking robot, our method significantly reduces double pick
errors while maintaining high performance.
- Abstract(参考訳): オブジェクト認識とインスタンスセグメンテーションは、あらゆるロボットや自律システムの基本的なスキルである。
既存の最先端の手法では、困難なシーンや曖昧なシーンで意味のある不確実性を捉えることができず、高性能なアプリケーションにおいて重大なエラーを引き起こすことがある。
本稿では,オブジェクトマスクの確率的仮説に対する不確かさをモデル化できる潜在符号を用いた分布型インスタンス分割モデルについて検討する。
ロボットピッキングアプリケーションでは,産業用途に必要な高精度化を実現するための信頼性マスク手法を提案する。
本手法は,ロボットアプリケーションにおける不明瞭なシーンのデータセットを含む,ロボットシステムの重大なエラーを著しく低減できることを示す。
実世界のアパレルピッキングロボットでは,高い性能を維持しながら2重ピック誤差を大幅に低減する。
関連論文リスト
- On the Black-box Explainability of Object Detection Models for Safe and Trustworthy Industrial Applications [7.848637922112521]
本稿では,物体検出モデルに対するモデルに依存しないXAI手法に着目し,分割マスク生成を用いた形態的フラクタル摂動ピラミッド(P)の拡張であるD-Pを提案する。
これらの手法を実世界の産業用・ロボット用データセット上で評価し,マスク数,モデルサイズ,画像解像度などのパラメータが説明の質に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2024-10-28T13:28:05Z) - Embodied Uncertainty-Aware Object Segmentation [38.52448300879023]
本研究では,不確実性を考慮したオブジェクトインスタンスセグメンテーション(UncOS)を導入し,対話型セグメンテーションの有用性を示す。
本研究では,大容量事前学習モデルの複数問合せを行うことにより,信頼度推定とともに,領域分割仮説の集合を得る。
アウトプットは、ロボットアクションを選択し、シーンを混乱させ、あいまいさを減らす、信念駆動のプロセスへの入力としても機能する。
論文 参考訳(メタデータ) (2024-08-08T21:29:22Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。
全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。
提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - A Causal Bayesian Network and Probabilistic Programming Based Reasoning Framework for Robot Manipulation Under Uncertainty [4.087774077861305]
本稿では,ロボットのための柔軟で汎用的な物理インフォームド型因果ベイズネットワーク(CBN)ベースのフレームワークを提案する。
1)高い精度で操作結果を予測する(Pred Acc: 88.6%)、(2)94.2%のタスク成功率でグリージーな次善行動選択を行う、というフレームワークの能力を示す。
論文 参考訳(メタデータ) (2024-03-21T15:36:26Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Formal Modelling for Multi-Robot Systems Under Uncertainty [11.21074891465253]
我々は不確実性下でのマルチロボットシステムのフォーマリズムのモデル化についてレビューする。
計画、強化学習、モデルチェック、シミュレーションにどのように使用できるかについて議論する。
論文 参考訳(メタデータ) (2023-05-26T15:23:35Z) - $f$-Cal: Calibrated aleatoric uncertainty estimation from neural
networks for robot perception [9.425514903472545]
既存のアプローチでは、ネットワークアーキテクチャ、推論手順、損失関数を変更することで、ニューラルネットワークの知覚スタックから不確実性を推定する。
私たちの重要な洞察は、キャリブレーションはミニバッチのような複数の例に制約を課すことでのみ達成できるということです。
ニューラルネットワークの出力分布を、$f$-divergenceを最小にすることで、ターゲット分布に類似させることにより、従来のアプローチに比べてはるかに優れた校正モデルが得られる。
論文 参考訳(メタデータ) (2021-09-28T17:57:58Z) - Multi Agent System for Machine Learning Under Uncertainty in Cyber
Physical Manufacturing System [78.60415450507706]
近年の予測機械学習の進歩は、製造における様々なユースケースに応用されている。
ほとんどの研究は、それに関連する不確実性に対処することなく予測精度を最大化することに焦点を当てた。
本稿では,機械学習における不確実性の原因を特定し,不確実性下での機械学習システムの成功基準を確立する。
論文 参考訳(メタデータ) (2021-07-28T10:28:05Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Where is my hand? Deep hand segmentation for visual self-recognition in
humanoid robots [129.46920552019247]
本稿では、画像からロボットの手を切り離すための畳み込みニューラルネットワーク(CNN)を提案する。
ヒューマノイドロボットVizzyの手のセグメンテーションのために,Mask-RCNNネットワークを微調整した。
論文 参考訳(メタデータ) (2021-02-09T10:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。