Fugu-MT 論文翻訳(概要): Diff$^2$I2P: Differentiable Image-to-Point Cloud Registration with Diffusion Prior

論文の概要: Diff$^2$I2P: Differentiable Image-to-Point Cloud Registration with Diffusion Prior

arxiv url: http://arxiv.org/abs/2507.06651v1
Date: Wed, 09 Jul 2025 08:30:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-10 17:37:43.526029
Title: Diff$^2$I2P: Differentiable Image-to-Point Cloud Registration with Diffusion Prior
Title（参考訳）: Diff$^2$I2P:Diffusion Priorによる微分可能画像対ポイントクラウド登録
Authors: Juncheng Mu, Chengwei Ren, Weixiang Zhang, Liang Pan, Xiao-Ping Zhang, Yue Gao,
Abstract要約: イメージ・ツー・ポイント・クラウド(I2P)の登録には、クロスモーダル対応が不可欠である。 Diff$2$I2P, 完全微分可能なI2P登録フレームワークを提案する。
参考スコア（独自算出の注目度）: 21.693977784321202
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learning cross-modal correspondences is essential for image-to-point cloud (I2P) registration. Existing methods achieve this mostly by utilizing metric learning to enforce feature alignment across modalities, disregarding the inherent modality gap between image and point data. Consequently, this paradigm struggles to ensure accurate cross-modal correspondences. To this end, inspired by the cross-modal generation success of recent large diffusion models, we propose Diff$^2$I2P, a fully Differentiable I2P registration framework, leveraging a novel and effective Diffusion prior for bridging the modality gap. Specifically, we propose a Control-Side Score Distillation (CSD) technique to distill knowledge from a depth-conditioned diffusion model to directly optimize the predicted transformation. However, the gradients on the transformation fail to backpropagate onto the cross-modal features due to the non-differentiability of correspondence retrieval and PnP solver. To this end, we further propose a Deformable Correspondence Tuning (DCT) module to estimate the correspondences in a differentiable way, followed by the transformation estimation using a differentiable PnP solver. With these two designs, the Diffusion model serves as a strong prior to guide the cross-modal feature learning of image and point cloud for forming robust correspondences, which significantly improves the registration. Extensive experimental results demonstrate that Diff$^2$I2P consistently outperforms SoTA I2P registration methods, achieving over 7% improvement in registration recall on the 7-Scenes benchmark.
Abstract（参考訳）: イメージ・ツー・ポイント・クラウド(I2P)登録には,クロスモーダル対応の学習が不可欠である。既存の方法は、主に、画像と点データの間に固有のモダリティギャップを無視して、モダリティを横断する特徴アライメントを強制するためにメートル法学習を利用することで、これを達成している。結果として、このパラダイムは、正確なクロスモーダル対応を保証するのに苦労する。この目的のために,近年の大規模拡散モデルにおけるクロスモーダル生成の成功に触発されたDiff$2$I2Pを提案する。具体的には,深度条件付き拡散モデルから知識を抽出し,予測変換を直接最適化する制御側スコア蒸留(CSD)手法を提案する。しかし、変換の勾配は、対応検索とPnPソルバの非微分性のため、クロスモーダルな特徴に逆転しない。この目的のために,変形可能な対応チューニング(DCT)モジュールを提案し,その次に微分可能なPnPソルバを用いた変換推定を行う。これらの2つの設計により、拡散モデルは、画像と点雲のクロスモーダルな特徴学習を導くための強力な先行として機能し、堅牢な対応を形成することにより、登録を大幅に改善する。 Diff$^2$I2PはSoTA I2Pの登録方法より一貫して優れており、7-Scenesベンチマークでは7%以上の登録リコールが達成されている。

関連論文リスト

Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。 Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文参考訳（メタデータ） (2025-06-24T17:58:02Z)
Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する既存の二項化法では性能が著しく低下する。画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳（メタデータ） (2024-06-09T10:30:25Z)
Provably Robust Score-Based Diffusion Posterior Sampling for Plug-and-Play Image Reconstruction [31.503662384666274]
科学と工学において、ゴールは、ある画像のモダリティを記述する既知のフォワードモデルから収集された少数の測定値から未知の画像を推測することである。モチベートされたスコアベース拡散モデルはその経験的成功により、画像再構成に先立って模範の印象的な候補として現れた。
論文参考訳（メタデータ） (2024-03-25T15:58:26Z)
Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文参考訳（メタデータ） (2023-12-05T18:59:41Z)
Exploring Straighter Trajectories of Flow Matching with Diffusion Guidance [66.4153984834872]
フローマッチング(StraightFM)のストレートトラジェクトリを提案する。分布レベル全体から拡散モデルによって導かれる結合戦略により軌道を直線化する。拡散法と従来のフローマッチング法の間で、FIDが低い視覚的に魅力的な画像を生成する。
論文参考訳（メタデータ） (2023-11-28T06:19:30Z)
SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D Object Pose Estimation [66.16525145765604]
実世界のシナリオにおける6次元オブジェクトポーズ推定のためのSE(3)拡散モデルに基づく点クラウド登録フレームワークを提案する。提案手法は,3次元登録タスクをデノナイズ拡散過程として定式化し,音源雲の姿勢を段階的に洗練する。実世界のTUD-L, LINEMOD, およびOccluded-LINEMODデータセットにおいて, 拡散登録フレームワークが顕著なポーズ推定性能を示すことを示す。
論文参考訳（メタデータ） (2023-10-26T12:47:26Z)
FreeReg: Image-to-Point Cloud Registration Leveraging Pretrained Diffusion Models and Monocular Depth Estimators [37.39693977657165]
イメージとポイントクラウド間のクロスモダリティ機能をマッチングすることは、イメージツーポイントクラウド登録の根本的な問題である。まず,事前学習した大規模モデルを用いて,画像と点雲のモダリティを統一することを提案する。画像から画像への拡散モデルから抽出した拡散特徴と呼ばれる中間的特徴が,画像と点雲の間で意味的に一致していることを示す。
論文参考訳（メタデータ） (2023-10-05T09:57:23Z)
Improving Misaligned Multi-modality Image Fusion with One-stage Progressive Dense Registration [67.23451452670282]
多モード画像間の相違は、画像融合の課題を引き起こす。マルチスケールプログレッシブ・センス・レジストレーション方式を提案する。このスキームは、一段階最適化のみで粗大な登録を行う。
論文参考訳（メタデータ） (2023-08-22T03:46:24Z)
Fourier Test-time Adaptation with Multi-level Consistency for Robust Classification [10.291631977766672]
本稿では,Fourier Test-Time Adaptation (FTTA) と呼ばれる新しい手法を提案する。 FTTAは、予測の自己監督を行うために、ペア入力の信頼性の高い多レベル整合性測定を構築する。異なる形態と器官を持つ3つの大きな分類データセットで広範囲に検証された。
論文参考訳（メタデータ） (2023-06-05T02:29:38Z)
Diffusion Model for Dense Matching [34.13580888014]
ペア画像間の密接な対応を確立する目的は、データ項と先行項の2つの項からなる。我々はDiffMatchを提案する。DiffMatchは、データと事前条件の両方を明示的にモデル化する新しい条件付き拡散ベースのフレームワークである。実験の結果,既存の手法に比べて,提案手法の大幅な性能向上が示された。
論文参考訳（メタデータ） (2023-05-30T14:58:24Z)
Learning Deformable Image Registration from Optimization: Perspective, Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文参考訳（メタデータ） (2020-04-30T03:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。