論文の概要: Generative 6D Pose Estimation via Conditional Flow Matching
- arxiv url: http://arxiv.org/abs/2602.19719v1
- Date: Mon, 23 Feb 2026 11:15:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.784608
- Title: Generative 6D Pose Estimation via Conditional Flow Matching
- Title(参考訳): 条件付き流れマッチングによる生成的6次元空間推定
- Authors: Amir Hamza, Davide Boscaini, Weihang Li, Benjamin Busam, Fabio Poiesi,
- Abstract要約: フロース (Flose) は、局所的な特徴によって条件付けられた認知過程を通じてオブジェクトのポーズを推測する生成法である。
Flose は、平均値 4.5 のリコールを平均的に改善し、従来の方法より優れています。
- 参考スコア(独自算出の注目度): 30.97901684878791
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing methods for instance-level 6D pose estimation typically rely on neural networks that either directly regress the pose in $\mathrm{SE}(3)$ or estimate it indirectly via local feature matching. The former struggle with object symmetries, while the latter fail in the absence of distinctive local features. To overcome these limitations, we propose a novel formulation of 6D pose estimation as a conditional flow matching problem in $\mathbb{R}^3$. We introduce Flose, a generative method that infers object poses via a denoising process conditioned on local features. While prior approaches based on conditional flow matching perform denoising solely based on geometric guidance, Flose integrates appearance-based semantic features to mitigate ambiguities caused by object symmetries. We further incorporate RANSAC-based registration to handle outliers. We validate Flose on five datasets from the established BOP benchmark. Flose outperforms prior methods with an average improvement of +4.5 Average Recall. Project Website : https://tev-fbk.github.io/Flose/
- Abstract(参考訳): 既存のインスタンスレベルの6Dポーズ推定方法は、通常、$\mathrm{SE}(3)$で直接ポーズを回帰するか、あるいは局所的な特徴マッチングによって間接的に推定するニューラルネットワークに依存する。
前者は対象対称性に苦しむが、後者は固有の局所的な特徴が欠如している。
これらの制約を克服するために、$\mathbb{R}^3$の条件付きフローマッチング問題として、6次元ポーズ推定の新たな定式化を提案する。
Floseは,局所的な特徴を前提とした認知過程を通じてオブジェクトのポーズを推定する生成手法である。
条件付きフローマッチングに基づく事前のアプローチは、幾何学的ガイダンスのみに基づくデノナイズを行う一方で、Floseは、外見に基づく意味的特徴を統合して、対象対称性によるあいまいさを軽減する。
我々はさらに、RANSACベースの登録をインクルードして、外れ値を処理する。
確立したBOPベンチマークから,Floseを5つのデータセットで検証する。
Flose は、平均値 4.5 のリコールを平均的に改善し、従来のメソッドよりもパフォーマンスがよい。
プロジェクトサイト:https://tev-fbk.github.io/Flose/
関連論文リスト
- Rectified Point Flow: Generic Point Cloud Pose Estimation [33.190452313116936]
本稿では,一対の点雲登録と複数部分形状の組立を条件付き単一生成問題として定式化する統一パラメータ化であるRectified Point Flowを紹介する。
提案手法は,ノイズの多い点を目標位置へ移動させる連続点速度場を学習し,その部分のポーズを復元する。
論文 参考訳(メタデータ) (2025-06-05T17:36:03Z) - Mixing-Denoising Generalizable Occupancy Networks [10.316008740970037]
現在の最先端の暗黙のニューラル形状モデルは、畳み込みの帰納的バイアスに依存している。
固有モデルバイアスを緩和し、再構成タスクに関連する補助正規化で仮説空間を制約する。
結果として得られたモデルは、ポイントクラウドネットワークからローカルに条件付けされた最初のMLPである。
論文 参考訳(メタデータ) (2023-11-20T19:05:57Z) - Revisiting Fully Convolutional Geometric Features for Object 6D Pose
Estimation [7.064953237013352]
我々は、FCGF(Fully Convolutional Geometric Features)を再検討し、オブジェクトの6Dポーズ推定を調整し、最先端の性能を達成する。
FCGFはスパース畳み込みを採用し、コントラスト損失を最適化することにより、完全畳み込みネットワークを用いてポイントレベルの特徴を学習する。
我々は、損失と入力データ表現に重要な変更を加えることで、人気のあるベンチマークにおいて、最近の競合より優れています。
論文 参考訳(メタデータ) (2023-07-28T12:16:31Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z) - GeoUDF: Surface Reconstruction from 3D Point Clouds via Geometry-guided
Distance Representation [73.77505964222632]
スパース点雲から離散曲面を再構成する問題に対処する学習ベース手法であるGeoUDFを提案する。
具体的には、UDFのための幾何誘導学習法とその勾配推定を提案する。
予測されたUDFから三角形メッシュを抽出するために,カスタマイズされたエッジベースマーチングキューブモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-30T06:02:01Z) - LocPoseNet: Robust Location Prior for Unseen Object Pose Estimation [69.70498875887611]
LocPoseNetは、見えないオブジェクトに先立って、ロバストにロケーションを学習することができる。
提案手法は,LINEMOD と GenMOP において,既存の作業よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-29T15:21:34Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。