論文の概要: Fast Uncertainty Quantification for Deep Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2011.07748v3
- Date: Fri, 26 Mar 2021 05:13:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 23:21:38.342243
- Title: Fast Uncertainty Quantification for Deep Object Pose Estimation
- Title(参考訳): 深部物体ポーズ推定のための高速不確かさ定量化
- Authors: Guanya Shi, Yifeng Zhu, Jonathan Tremblay, Stan Birchfield, Fabio
Ramos, Animashree Anandkumar, Yuke Zhu
- Abstract要約: 深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
- 参考スコア(独自算出の注目度): 91.09217713805337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based object pose estimators are often unreliable and
overconfident especially when the input image is outside the training domain,
for instance, with sim2real transfer. Efficient and robust uncertainty
quantification (UQ) in pose estimators is critically needed in many robotic
tasks. In this work, we propose a simple, efficient, and plug-and-play UQ
method for 6-DoF object pose estimation. We ensemble 2-3 pre-trained models
with different neural network architectures and/or training data sources, and
compute their average pairwise disagreement against one another to obtain the
uncertainty quantification. We propose four disagreement metrics, including a
learned metric, and show that the average distance (ADD) is the best
learning-free metric and it is only slightly worse than the learned metric,
which requires labeled target data. Our method has several advantages compared
to the prior art: 1) our method does not require any modification of the
training process or the model inputs; and 2) it needs only one forward pass for
each model. We evaluate the proposed UQ method on three tasks where our
uncertainty quantification yields much stronger correlations with pose
estimation errors than the baselines. Moreover, in a real robot grasping task,
our method increases the grasping success rate from 35% to 90%.
- Abstract(参考訳): 深層学習に基づくオブジェクトポーズ推定器は、特に入力画像がトレーニング領域の外にある場合、特にsim2real転送で信頼性が低い。
多くのロボット作業において、ポーズ推定器における効率的で堅牢な不確実性定量化(UQ)が不可欠である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的なプラグアンドプレイUQ手法を提案する。
我々は,ニューラルネットワークアーキテクチャやデータソースの異なる事前学習モデル2-3をアンサンブルし,その平均的なペアワイズ不一致を計算して不確実性定量化を行う。
我々は,学習指標を含む4つの不一致指標を提案し,平均距離(加算)が最高の学習フリーメトリクスであり,ラベル付き対象データを必要とする学習指標よりもわずかに悪いことを示す。
本手法は先行技術に比べていくつかの利点がある。
1)本手法は,トレーニングプロセスやモデル入力の変更を一切必要とせず,かつ,
2) 各モデルに1回のみのフォワードパスが必要となる。
提案手法は,不確かさの定量化がベースラインよりもポーズ推定誤差に強い相関をもたらす3つのタスクについて評価する。
さらに,本手法では,実際のロボット把握作業において,達成率を35%から90%に向上させる。
関連論文リスト
- Distilling from Similar Tasks for Transfer Learning on a Budget [38.998980344852846]
転送学習は、ラベルの少ないトレーニングに有効なソリューションであるが、大きなベースモデルの計算的にコストのかかる微調整を犠牲にすることがしばしばある。
本稿では,半教師付きクロスドメイン蒸留による計算と精度のトレードオフを軽減することを提案する。
我々の手法は、ソースデータにアクセスする必要はなく、単にソースモデルの機能や擬似ラベルが必要なだけである。
論文 参考訳(メタデータ) (2023-04-24T17:59:01Z) - Post-hoc Uncertainty Learning using a Dirichlet Meta-Model [28.522673618527417]
本研究では,不確実性定量化能力の優れた事前学習モデルを構築するための新しいベイズメタモデルを提案する。
提案手法は追加のトレーニングデータを必要としないため,不確かさの定量化に十分な柔軟性がある。
提案するメタモデルアプローチの柔軟性と,これらのアプリケーションに対する優れた経験的性能を実証する。
論文 参考訳(メタデータ) (2022-12-14T17:34:11Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - The Right Tool for the Job: Matching Model and Instance Complexities [62.95183777679024]
NLPモデルが大きくなればなるほど、訓練されたモデルを実行するには、金銭的・環境的なコストを発生させる重要な計算資源が必要である。
我々は、推論中、早期(かつ高速)の"exit"を可能にする文脈表現微調整の修正を提案する。
3つのテキスト分類データセットと2つの自然言語推論ベンチマークの2つのタスクで、5つの異なるデータセットに対して提案した修正を検証した。
論文 参考訳(メタデータ) (2020-04-16T04:28:08Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。