論文の概要: SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D
Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2310.17359v1
- Date: Thu, 26 Oct 2023 12:47:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 20:30:40.173840
- Title: SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D
Object Pose Estimation
- Title(参考訳): SE(3) 拡散モデルに基づくロバスト6次元オブジェクト位置推定のための点クラウド登録
- Authors: Haobo Jiang, Mathieu Salzmann, Zheng Dang, Jin Xie, and Jian Yang
- Abstract要約: 実世界のシナリオにおける6次元オブジェクトポーズ推定のためのSE(3)拡散モデルに基づく点クラウド登録フレームワークを提案する。
提案手法は,3次元登録タスクをデノナイズ拡散過程として定式化し,音源雲の姿勢を段階的に洗練する。
実世界のTUD-L, LINEMOD, およびOccluded-LINEMODデータセットにおいて, 拡散登録フレームワークが顕著なポーズ推定性能を示すことを示す。
- 参考スコア(独自算出の注目度): 66.16525145765604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce an SE(3) diffusion model-based point cloud
registration framework for 6D object pose estimation in real-world scenarios.
Our approach formulates the 3D registration task as a denoising diffusion
process, which progressively refines the pose of the source point cloud to
obtain a precise alignment with the model point cloud. Training our framework
involves two operations: An SE(3) diffusion process and an SE(3) reverse
process. The SE(3) diffusion process gradually perturbs the optimal rigid
transformation of a pair of point clouds by continuously injecting noise
(perturbation transformation). By contrast, the SE(3) reverse process focuses
on learning a denoising network that refines the noisy transformation
step-by-step, bringing it closer to the optimal transformation for accurate
pose estimation. Unlike standard diffusion models used in linear Euclidean
spaces, our diffusion model operates on the SE(3) manifold. This requires
exploiting the linear Lie algebra $\mathfrak{se}(3)$ associated with SE(3) to
constrain the transformation transitions during the diffusion and reverse
processes. Additionally, to effectively train our denoising network, we derive
a registration-specific variational lower bound as the optimization objective
for model learning. Furthermore, we show that our denoising network can be
constructed with a surrogate registration model, making our approach applicable
to different deep registration networks. Extensive experiments demonstrate that
our diffusion registration framework presents outstanding pose estimation
performance on the real-world TUD-L, LINEMOD, and Occluded-LINEMOD datasets.
- Abstract(参考訳): 本稿では,現実シナリオにおける6次元オブジェクトポーズ推定のためのSE(3)拡散モデルに基づく点クラウド登録フレームワークを提案する。
提案手法は, 3D 登録タスクをデノナイズ拡散過程として定式化し, 原点雲の姿勢を段階的に洗練し, モデル点雲との正確な整合を得る。
フレームワークのトレーニングには、SE(3)拡散プロセスとSE(3)逆プロセスという2つの操作が含まれる。
SE(3)拡散過程は、ノイズ(摂動変換)を連続的に注入することによって、一対の点雲の最適な剛性変換を徐々に摂動する。
対照的に、se(3)逆プロセスは、ノイズのある変換を段階的に洗練し、正確なポーズ推定のための最適な変換に近づける、分調ネットワークの学習に焦点を当てている。
線型ユークリッド空間で使われる標準拡散モデルとは異なり、我々の拡散モデルは SE(3) 多様体上で動く。
これにより線型リー代数 $\mathfrak{se}(3)$ を SE(3) に関連付け、拡散過程と逆過程の間の変換遷移を制限する必要がある。
さらに,分散ネットワークを効果的にトレーニングするために,モデル学習のための最適化目標として,登録固有の変分下限を導出する。
さらに,提案手法を異なる深層登録ネットワークに適用できるように,サブロゲート登録モデルを用いてデノイジングネットワークを構築することができることを示した。
我々の拡散登録フレームワークは,実世界のTUD-L,LINEMOD,Occluded-LINEMODデータセットに対して優れたポーズ推定性能を示す。
関連論文リスト
- Bayesian Diffusion Models for 3D Shape Reconstruction [57.44181038281908]
本稿では,トップダウン(優先)情報をボトムアップ(データ駆動)手順と密結合することにより,効果的なベイズ推定を行う予測アルゴリズムを提案する。
3次元形状復元作業におけるBDMの有効性を示す。
論文 参考訳(メタデータ) (2024-03-11T17:55:53Z) - A locally statistical active contour model for SAR image segmentation
can be solved by denoising algorithms [6.965119490863576]
実SAR画像に対する実験結果から,提案した画像分割モデルは,弱い辺やぼやけた辺での輪郭を効率的に阻止できることが示された。
提案したFPRD1/FPRD2モデルは、スプリット・ブレグマン法に基づくSBRDモデルに必要な時間の約1/2(またはそれ以下)である。
論文 参考訳(メタデータ) (2024-01-10T00:27:14Z) - 6D-Diff: A Keypoint Diffusion Framework for 6D Object Pose Estimation [17.74361361460489]
単一のRGB画像から6Dオブジェクトのポーズを推定することは、しばしばノイズと不確定性を伴う。
本稿では,オブジェクトのポーズ推定におけるノイズと不確定性を扱うための拡散に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-29T05:28:35Z) - DiffusionPCR: Diffusion Models for Robust Multi-Step Point Cloud
Registration [73.37538551605712]
ポイントクラウド登録(PCR)は、2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では, PCR を拡散確率過程として定式化し, ノイズ変換を基礎的真理にマッピングする。
実験ではDiffusionPCRの有効性を示し,3Dおよび3DLoMatchに対する最先端の登録リコール率(95.3%/81.6%)を得た。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。
まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。
第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-02T02:27:58Z) - 3DifFusionDet: Diffusion Model for 3D Object Detection with Robust
LiDAR-Camera Fusion [6.914463996768285]
3DifFusionDetはノイズの多い3Dボックスからターゲットボックスへのノイズ拡散プロセスとして3Dオブジェクトを検出する。
特徴整合戦略の下では、プログレッシブ改良法はロバストLiDAR-Camera融合に重要な貢献をする可能性がある。
実世界の交通物体識別のベンチマークであるKITTIの実験では、3DifFusionDetが以前のよく検討された検出器と比較して好適に動作できることが判明した。
論文 参考訳(メタデータ) (2023-11-07T05:53:09Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - Diffusion with Forward Models: Solving Stochastic Inverse Problems
Without Direct Supervision [76.32860119056964]
本稿では,直接観測されない信号の分布からサンプルを学習する拡散確率モデルを提案する。
コンピュータビジョンの課題3つの課題に対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-06-20T17:53:00Z) - Deep Learning for Regularization Prediction in Diffeomorphic Image
Registration [8.781861951759948]
微分同相変換の滑らかさを制御するパラメータを自動的に決定する新しいフレームワークを導入する。
画像登録の正規化パラメータとペア画像間のマッピングを学習する深層畳み込みニューラルネットワーク(CNN)に基づく予測モデルを開発した。
実験結果から,本モデルは画像登録のための適切な正規化パラメータを予測できるだけでなく,時間とメモリ効率の面でネットワークトレーニングを改善することが示唆された。
論文 参考訳(メタデータ) (2020-11-28T22:56:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。