論文の概要: WALDO: Where Unseen Model-based 6D Pose Estimation Meets Occlusion
- arxiv url: http://arxiv.org/abs/2511.15874v1
- Date: Wed, 19 Nov 2025 21:01:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.374207
- Title: WALDO: Where Unseen Model-based 6D Pose Estimation Meets Occlusion
- Title(参考訳): WALDO: 見当たらないモデルベースの6D Poseの推定が除外される
- Authors: Sajjad Pakdamansavoji, Yintao Ma, Amir Rasouli, Tongtong Cao,
- Abstract要約: モデルに基づく6次元ポーズ推定法に対する4つの新しい拡張を提案する。
提案手法は,IABINの精度が5%以上向上し,BOPデータセットのベンチマークでは2%以上向上していることを示す。
- 参考スコア(独自算出の注目度): 13.760323763554448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate 6D object pose estimation is vital for robotics, augmented reality, and scene understanding. For seen objects, high accuracy is often attainable via per-object fine-tuning but generalizing to unseen objects remains a challenge. To address this problem, past arts assume access to CAD models at test time and typically follow a multi-stage pipeline to estimate poses: detect and segment the object, propose an initial pose, and then refine it. Under occlusion, however, the early-stage of such pipelines are prone to errors, which can propagate through the sequential processing, and consequently degrade the performance. To remedy this shortcoming, we propose four novel extensions to model-based 6D pose estimation methods: (i) a dynamic non-uniform dense sampling strategy that focuses computation on visible regions, reducing occlusion-induced errors; (ii) a multi-hypothesis inference mechanism that retains several confidence-ranked pose candidates, mitigating brittle single-path failures; (iii) iterative refinement to progressively improve pose accuracy; and (iv) series of occlusion-focused training augmentations that strengthen robustness and generalization. Furthermore, we propose a new weighted by visibility metric for evaluation under occlusion to minimize the bias in the existing protocols. Via extensive empirical evaluations, we show that our proposed approach achieves more than 5% improvement in accuracy on ICBIN and more than 2% on BOP dataset benchmarks, while achieving approximately 3 times faster inference.
- Abstract(参考訳): ロボット工学、拡張現実、シーン理解には正確な6Dオブジェクトのポーズ推定が不可欠である。
オブジェクトごとの微調整によって高い精度が得られることが多いが、見えないオブジェクトへの一般化は依然として難しい課題である。
この問題に対処するために、パスアートはテスト時にCADモデルへのアクセスを前提としており、一般的には多段階パイプラインに従ってポーズを推定する。
しかし、閉塞下では、そのようなパイプラインの初期段階はエラーを起こしやすいため、シーケンシャルな処理を通じて伝播し、結果として性能が低下する。
この欠点を解消するために,モデルに基づく6次元ポーズ推定法に対する4つの新しい拡張を提案する。
一 目に見える領域に計算を集中させ、閉塞による誤りを低減させる動的非一様密集サンプリング戦略
(二)信頼度の高いポーズ候補を複数保持し、脆い単一経路障害を緩和する多仮説推論機構
三 ポーズの精度を段階的に向上させる反復改良及び
(4) 強靭性と一般化性を高める閉塞型トレーニング強化のシリーズ。
さらに,既存のプロトコルのバイアスを最小限に抑えるため,オクルージョンによる評価のための視認度測定手法を提案する。
ICBINの精度は5%以上,BOPのベンチマークでは2%以上向上し,推定精度は約3倍向上した。
関連論文リスト
- Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - UnPose: Uncertainty-Guided Diffusion Priors for Zero-Shot Pose Estimation [19.76147681894604]
UnPoseはゼロショットでモデルなしの6Dオブジェクトのポーズ推定と再構成のためのフレームワークである。
事前訓練された拡散モデルから3Dの先行値と不確実性の推定値を利用する。
6次元ポーズ推定精度と3次元再構成品質の両方において、既存のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2025-08-21T21:31:04Z) - DeProPose: Deficiency-Proof 3D Human Pose Estimation via Adaptive Multi-View Fusion [57.83515140886807]
欠陥認識型3Dポーズ推定の課題について紹介する。
DeProPoseは、トレーニングの複雑さを減らすために、ネットワークアーキテクチャをシンプルにするためのフレキシブルなメソッドである。
我々は,新しい3次元ポーズ推定データセットを開発した。
論文 参考訳(メタデータ) (2025-02-23T03:22:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - REDE: End-to-end Object 6D Pose Robust Estimation Using Differentiable
Outliers Elimination [15.736699709454857]
RGB-Dデータを用いた新しいエンドツーエンドオブジェクトポーズ推定器REDEを提案する。
また,候補結果と信頼度を同時に抑制する相違可能な外乱除去手法を提案する。
3つのベンチマークデータセットの実験結果は、REDEが最先端のアプローチをわずかに上回っていることを示している。
論文 参考訳(メタデータ) (2020-10-24T06:45:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。