論文の概要: LiDPM: Rethinking Point Diffusion for Lidar Scene Completion
- arxiv url: http://arxiv.org/abs/2504.17791v1
- Date: Thu, 24 Apr 2025 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.498341
- Title: LiDPM: Rethinking Point Diffusion for Lidar Scene Completion
- Title(参考訳): LiDPM:ライダーシーンの完成に向けて点拡散を再考
- Authors: Tetiana Martyniuk, Gilles Puy, Alexandre Boulch, Renaud Marlet, Raoul de Charette,
- Abstract要約: 屋外シーンの規模でライダーポイントに直接作用する拡散モデルの訓練は困難である。
オリジナルDDPMを局所拡散過程として再構成する。
提案手法は,セマンティックKITTIのシーン補完において,より優れた結果をもたらすことを示す。
- 参考スコア(独自算出の注目度): 64.59440146147261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training diffusion models that work directly on lidar points at the scale of outdoor scenes is challenging due to the difficulty of generating fine-grained details from white noise over a broad field of view. The latest works addressing scene completion with diffusion models tackle this problem by reformulating the original DDPM as a local diffusion process. It contrasts with the common practice of operating at the level of objects, where vanilla DDPMs are currently used. In this work, we close the gap between these two lines of work. We identify approximations in the local diffusion formulation, show that they are not required to operate at the scene level, and that a vanilla DDPM with a well-chosen starting point is enough for completion. Finally, we demonstrate that our method, LiDPM, leads to better results in scene completion on SemanticKITTI. The project page is https://astra-vision.github.io/LiDPM .
- Abstract(参考訳): 広い視野でホワイトノイズからきめ細かな詳細を生成できないため,屋外シーンの規模でライダーポイント上で直接作業する訓練拡散モデルは困難である。
拡散モデルを用いてシーン完了に対処する最新の研究は、元のDDPMを局所拡散過程として再構成することでこの問題に対処している。
これは、現在バニラDDPMが使われているオブジェクトのレベルで運用する一般的なプラクティスとは対照的である。
この作業では、これらの2つの仕事のギャップを埋めます。
局所拡散定式化の近似を同定し,シーンレベルでの操作は不要であり,良好な開始点を持つバニラDDPMが完成するのに十分であることを示す。
最後に,提案手法であるLiDPMがセマンティックKITTIのシーン完了により良い結果をもたらすことを示す。
プロジェクトページはhttps://astra-vision.github.io/LiDPM である。
関連論文リスト
- Improved Diffusion-based Generative Model with Better Adversarial Robustness [65.38540020916432]
拡散確率モデル(DPM)は、生成タスクにおいて大きな成功を収めた。
デノナイジングプロセスでは、入力データ分布はトレーニングと推論の段階によって異なる。
論文 参考訳(メタデータ) (2025-02-24T12:29:16Z) - Diffusion-Based Attention Warping for Consistent 3D Scene Editing [55.2480439325792]
拡散モデルを用いた3次元シーン編集のための新しい手法を提案する。
提案手法は,単一の参照画像から抽出した注目機能を利用して,意図した編集を定義する。
これらの歪んだ特徴を他の視点に注入することで、編集のコヒーレントな伝播を可能にする。
論文 参考訳(メタデータ) (2024-12-10T23:57:18Z) - Move Anything with Layered Scene Diffusion [77.45870343845492]
拡散サンプリング過程におけるシーン表現を最適化するために,SceneDiffusionを提案する。
我々の重要な洞察は、異なる空間配置のシーンレンダリングを共同でデノベートすることで、空間的ゆがみを得ることができることである。
生成したシーンは、移動、再サイズ、クローニング、レイヤーワイドな外観編集操作を含む、幅広い空間編集操作をサポートする。
論文 参考訳(メタデータ) (2024-04-10T17:28:16Z) - Scaling Diffusion Models to Real-World 3D LiDAR Scene Completion [25.69896680908217]
3D LiDARセンサーは、通常、シーンからスパース3Dポイントの雲を収集するために使用される。
本稿では,1枚のLiDARスキャンからシーン完了を実現するために,画像の生成モデルとして拡散モデルを拡張することを提案する。
提案手法は,1つのLiDARスキャンを入力としてシーンを完了し,最先端のシーン補完手法と比較して,より詳細なシーンを生成する。
論文 参考訳(メタデータ) (2024-03-20T10:19:05Z) - LIME: Localized Image Editing via Attention Regularization in Diffusion Models [69.33072075580483]
本稿では拡散モデルにおける局所化画像編集のためのLIMEを提案する。
LIMEは、ユーザが指定した関心領域(RoI)や追加のテキスト入力を必要としない。
そこで本研究では,RoIにおける非関係なクロスアテンションスコアをデノナイジングステップ中にペナライズし,局所的な編集を確実にする新しいクロスアテンション正規化手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T18:59:59Z) - LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models [54.93010869546011]
本稿では,事前学習した潜伏拡散モデルを用いて,超低照度画像の高精細化のためのニューラルISPを実現することを提案する。
具体的には、RAWドメイン上で動作するために事前訓練された潜在拡散モデルを調整するために、軽量なテーミングモジュールのセットをトレーニングする。
遅延拡散モデルにおけるUNet復調と復号化の異なる役割を観察し、低照度画像強調タスクを遅延空間低周波コンテンツ生成と復号位相高周波ディテール保守に分解するきっかけとなる。
論文 参考訳(メタデータ) (2023-12-02T04:31:51Z) - MonoDiffusion: Self-Supervised Monocular Depth Estimation Using
Diffusion Model [17.68594761862957]
我々はMonoDiffusionと呼ばれる新しい自己教師型深度推定フレームワークを導入し,それを反復的復調過程として定式化する。
トレーニング段階では深部地下構造は利用できないため,モノ拡散の拡散を補助する擬似地下構造拡散プロセスを開発する。
擬似地動拡散は、事前訓練された教師モデルによって生成された深度マップに徐々にノイズを付加する。
論文 参考訳(メタデータ) (2023-11-13T09:38:30Z) - UDPM: Upsampling Diffusion Probabilistic Models [33.51145642279836]
拡散確率モデル(DDPM、Denoising Diffusion Probabilistic Models)は近年注目されている。
DDPMは逆プロセスを定義することによって複雑なデータ分布から高品質なサンプルを生成する。
生成逆数ネットワーク(GAN)とは異なり、拡散モデルの潜伏空間は解釈できない。
本研究では,デノナイズ拡散過程をUDPM(Upsampling Diffusion Probabilistic Model)に一般化することを提案する。
論文 参考訳(メタデータ) (2023-05-25T17:25:14Z) - Blended Latent Diffusion [18.043090347648157]
本稿では,汎用画像の局所的なテキスト駆動編集の課題に対して,ユーザが提供するマスクに所望の編集を限定する高速化されたソリューションを提案する。
提案手法は,低次元の潜伏空間で操作することで拡散を高速化する,最近のテキストから画像への潜伏拡散モデル (LDM) を利用する。
論文 参考訳(メタデータ) (2022-06-06T17:58:04Z) - Layout-to-Image Translation with Double Pooling Generative Adversarial
Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。
また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文 参考訳(メタデータ) (2021-08-29T19:55:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。