論文の概要: For A More Comprehensive Evaluation of 6DoF Object Pose Tracking
- arxiv url: http://arxiv.org/abs/2309.07796v2
- Date: Fri, 15 Sep 2023 02:30:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-18 11:29:48.693054
- Title: For A More Comprehensive Evaluation of 6DoF Object Pose Tracking
- Title(参考訳): 6dof物体ポーズ追跡のより包括的評価のために
- Authors: Yang Li, Fan Zhong, Xin Wang, Shuangbing Song, Jiachen Li, Xueying Qin
and Changhe Tu
- Abstract要約: 上記の問題に対処するために、統一されたベンチマークに貢献する。
YCBVのより正確なアノテーションとして,多視点多目的グローバルポーズ改善法を提案する。
実験では,リアルな半合成データセットを用いて,提案手法の精度と信頼性を検証した。
- 参考スコア(独自算出の注目度): 22.696375341994035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous evaluations on 6DoF object pose tracking have presented obvious
limitations along with the development of this area. In particular, the
evaluation protocols are not unified for different methods, the widely-used
YCBV dataset contains significant annotation error, and the error metrics also
may be biased. As a result, it is hard to fairly compare the methods, which has
became a big obstacle for developing new algorithms. In this paper we
contribute a unified benchmark to address the above problems. For more accurate
annotation of YCBV, we propose a multi-view multi-object global pose refinement
method, which can jointly refine the poses of all objects and view cameras,
resulting in sub-pixel sub-millimeter alignment errors. The limitations of
previous scoring methods and error metrics are analyzed, based on which we
introduce our improved evaluation methods. The unified benchmark takes both
YCBV and BCOT as base datasets, which are shown to be complementary in scene
categories. In experiments, we validate the precision and reliability of the
proposed global pose refinement method with a realistic semi-synthesized
dataset particularly for YCBV, and then present the benchmark results unifying
learning&non-learning and RGB&RGBD methods, with some finds not discovered in
previous studies.
- Abstract(参考訳): 6DoFオブジェクトのポーズトラッキングに関する以前の評価では、この領域の開発とともに明らかな限界が示されている。
特に、評価プロトコルは異なるメソッドに対して統一されておらず、広く使われているYCBVデータセットには重要なアノテーションエラーが含まれており、エラーメトリクスにもバイアスがある可能性がある。
その結果、新しいアルゴリズムを開発する上で大きな障害となっている手法を適切に比較することは困難である。
本稿では,上記の問題に対処するための統一ベンチマークを提案する。
ycbvのより正確なアノテーションのために、全てのオブジェクトのポーズを洗練し、カメラを視認し、ピクセル以下のサブミリ波アライメントエラーを生じさせるマルチビューマルチオブジェクト・グローバルポーズリファインメント法を提案する。
従来のスコアリング手法と誤差指標の限界を分析し,改良された評価手法を紹介する。
統一されたベンチマークでは、YCBVとBCOTの両方をベースデータセットとしており、シーンカテゴリで補完的であることが示されている。
実験では,提案手法の精度と信頼性を,特にycbvのための現実的な半合成データセットを用いて検証し,そのベンチマーク結果を用いて学習非学習法とrgb&rgbd法を統一した。
関連論文リスト
- SEMPose: A Single End-to-end Network for Multi-object Pose Estimation [13.131534219937533]
SEMPoseは、エンドツーエンドの多目的ポーズ推定ネットワークである。
RGB画像以外の入力を必要とせずに32FPSで推論を行うことができる。
複数のオブジェクトのポーズをリアルタイムで正確に推定でき、対象オブジェクトの数の影響を受けない推論時間に影響を及ぼす。
論文 参考訳(メタデータ) (2024-11-21T10:37:54Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Revisiting Evaluation Metrics for Semantic Segmentation: Optimization
and Evaluation of Fine-grained Intersection over Union [113.20223082664681]
そこで本研究では,mIoUsの微細化と,それに対応する最悪の指標を提案する。
これらのきめ細かいメトリクスは、大きなオブジェクトに対するバイアスの低減、よりリッチな統計情報、モデルとデータセット監査に関する貴重な洞察を提供する。
ベンチマークでは,1つの測定値に基づかないことの必要性を強調し,微細なmIoUsが大きな物体への偏りを減少させることを確認した。
論文 参考訳(メタデータ) (2023-10-30T03:45:15Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - On the Evaluation of RGB-D-based Categorical Pose and Shape Estimation [5.71097144710995]
この研究では、メトリクスやデータセットを含む、この主要な評価プロトコルを批判的に見ていきます。
我々は、新しいメトリクスセットを提案し、Redwoodデータセットに新しいアノテーションを提供し、公正な比較で最先端の手法を評価する。
論文 参考訳(メタデータ) (2022-02-21T16:31:18Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - TISE: A Toolbox for Text-to-Image Synthesis Evaluation [9.092600296992925]
単目的と多目的のテキスト・ツー・イメージ合成のための最先端手法の研究を行う。
これらの手法を評価するための共通フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-02T16:39:35Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - A Hybrid Approach for 6DoF Pose Estimation [4.200736775540874]
本稿では,最先端のディープラーニング型インスタンス検出器を用いた6DoFポーズ推定手法を提案する。
さらに、インスタンス検出器とトレーニングセットを検証セット上で最高のパフォーマンスで選択する自動メソッド選択も使用します。
このハイブリッドアプローチは、CNNを用いて高度に構造化されていないデータをフィルタリングし、クラッタを切断し、頑健なポーズ推定のために証明された収束を伴う局所幾何学的アプローチを用いて、学習と古典的アプローチのベストを生かしている。
論文 参考訳(メタデータ) (2020-11-11T09:58:23Z) - REDE: End-to-end Object 6D Pose Robust Estimation Using Differentiable
Outliers Elimination [15.736699709454857]
RGB-Dデータを用いた新しいエンドツーエンドオブジェクトポーズ推定器REDEを提案する。
また,候補結果と信頼度を同時に抑制する相違可能な外乱除去手法を提案する。
3つのベンチマークデータセットの実験結果は、REDEが最先端のアプローチをわずかに上回っていることを示している。
論文 参考訳(メタデータ) (2020-10-24T06:45:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。