論文の概要: AlignPose: Generalizable 6D Pose Estimation via Multi-view Feature-metric Alignment
- arxiv url: http://arxiv.org/abs/2512.20538v1
- Date: Tue, 23 Dec 2025 17:29:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.95203
- Title: AlignPose: Generalizable 6D Pose Estimation via Multi-view Feature-metric Alignment
- Title(参考訳): AlignPose: 多視点特徴量アライメントによる一般化可能な6次元ポーズ推定
- Authors: Anna Šárová Mikeštíková, Médéric Fourmy, Martin Cífka, Josef Sivic, Vladimir Petrik,
- Abstract要約: 本稿では,複数のRGBビューから情報を集約する6次元オブジェクトポーズ推定手法であるAlignPoseを紹介する。
このアプローチの鍵となるコンポーネントは、オブジェクトのポーズ用に特別に設計された、新しいマルチビュー特徴量改善である。
単一の一貫した世界フレームオブジェクトのポーズを最適化し、オンザフライでレンダリングされたオブジェクト特徴と観察された画像特徴との間の特徴差を最小限にする。
- 参考スコア(独自算出の注目度): 18.198789096671245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-view RGB model-based object pose estimation methods achieve strong generalization but are fundamentally limited by depth ambiguity, clutter, and occlusions. Multi-view pose estimation methods have the potential to solve these issues, but existing works rely on precise single-view pose estimates or lack generalization to unseen objects. We address these challenges via the following three contributions. First, we introduce AlignPose, a 6D object pose estimation method that aggregates information from multiple extrinsically calibrated RGB views and does not require any object-specific training or symmetry annotation. Second, the key component of this approach is a new multi-view feature-metric refinement specifically designed for object pose. It optimizes a single, consistent world-frame object pose minimizing the feature discrepancy between on-the-fly rendered object features and observed image features across all views simultaneously. Third, we report extensive experiments on four datasets (YCB-V, T-LESS, ITODD-MV, HouseCat6D) using the BOP benchmark evaluation and show that AlignPose outperforms other published methods, especially on challenging industrial datasets where multiple views are readily available in practice.
- Abstract(参考訳): シングルビューRGBモデルに基づくオブジェクトポーズ推定法は強力な一般化を実現するが、基本的には深さのあいまいさ、乱れ、閉塞によって制限される。
マルチビューポーズ推定法はこれらの問題を解決する可能性があるが、既存の研究は正確な単一ビューポーズ推定に依存している。
これらの課題に,以下の3つのコントリビューションを通じて対処する。
まず,複数の外部キャリブレーションされたRGBビューから情報を集約する6次元オブジェクトポーズ推定手法であるAlignPoseを紹介し,オブジェクト固有のトレーニングや対称性のアノテーションを必要としない。
第二に、このアプローチの鍵となるコンポーネントは、オブジェクトのポーズ用に特別に設計された、新しいマルチビュー特徴量改善である。
オンザフライでレンダリングされたオブジェクト機能と、すべてのビューで同時に観察される画像機能との間の特徴差を最小限に抑える、一貫した1つの世界フレームオブジェクトポーズを最適化する。
第3に、BOPベンチマーク評価を用いた4つのデータセット(YCB-V, T-LESS, ITODD-MV, HouseCat6D)に関する広範な実験を行い、AlignPoseが他の公開手法よりも優れていることを示す。
関連論文リスト
- PoseGAM: Robust Unseen Object Pose Estimation via Geometry-Aware Multi-View Reasoning [49.66437612420291]
PoseGAMは、クエリ画像と複数のテンプレート画像からオブジェクトのポーズを直接予測する幾何学的なマルチビューフレームワークである。
多様な環境条件下で190k以上のオブジェクトを含む大規模合成データセットを構築した。
論文 参考訳(メタデータ) (2025-12-11T17:29:25Z) - One2Any: One-Reference 6D Pose Estimation for Any Object [98.50085481362808]
6Dオブジェクトのポーズ推定は、完全な3Dモデルへの依存、マルチビューイメージ、特定のオブジェクトカテゴリに限定したトレーニングのため、多くのアプリケーションにとって依然として困難である。
本稿では,単一の参照単一クエリRGB-D画像のみを用いて,相対6自由度(DOF)オブジェクトのポーズを推定する新しい手法One2Anyを提案する。
複数のベンチマークデータセットの実験により、我々のモデルは新しいオブジェクトによく一般化し、最先端の精度を実現し、また、コンピュータのごく一部でマルチビューやCAD入力を必要とする競合する手法さえも実現している。
論文 参考訳(メタデータ) (2025-05-07T03:54:59Z) - BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation [81.24160191975781]
本稿では、スパースビュー設定における課題に対処するために、オブジェクトポーズ推定のための汎用RGBベースのアプローチを提案する。
これらの制約を克服するために、オブジェクトのポーズの中間表現としてオブジェクト境界ボックスのコーナーポイントを導入する。
3Dオブジェクトコーナーはスパース入力ビューから確実に復元でき、対象ビューの2Dコーナーポイントは、新しい参照ベースポイントデータセットによって推定される。
論文 参考訳(メタデータ) (2025-04-10T17:58:35Z) - Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。
本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文 参考訳(メタデータ) (2024-11-24T14:31:50Z) - Multi-view object pose estimation from correspondence distributions and
epipolar geometry [0.0]
本稿では,学習した2D-3D分布を,初期推定と任意修正の両方のために複数の視点から集約する多視点ポーズ推定手法を提案する。
提案手法は,最も優れた単一視点法と比較して,ポーズ推定誤差を80~91%削減する。
論文 参考訳(メタデータ) (2022-10-03T13:30:40Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - CosyPose: Consistent multi-view multi-object 6D pose estimation [48.097599674329004]
単視点単体6次元ポーズ推定法を提案し、6次元オブジェクトのポーズ仮説を生成する。
第2に、異なる入力画像間で個々の6次元オブジェクトのポーズをマッチングするロバストな手法を開発する。
第3に、複数のオブジェクト仮説とそれらの対応性を考慮したグローバルなシーン改善手法を開発した。
論文 参考訳(メタデータ) (2020-08-19T14:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。