論文の概要: TopoLiDM: Topology-Aware LiDAR Diffusion Models for Interpretable and Realistic LiDAR Point Cloud Generation
- arxiv url: http://arxiv.org/abs/2507.22454v1
- Date: Wed, 30 Jul 2025 08:02:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:18.079095
- Title: TopoLiDM: Topology-Aware LiDAR Diffusion Models for Interpretable and Realistic LiDAR Point Cloud Generation
- Title(参考訳): TopoLiDM: 解釈可能・現実的LiDAR点雲生成のためのトポロジーを考慮したLiDAR拡散モデル
- Authors: Jiuming Liu, Zheng Huang, Mengmeng Liu, Tianchen Deng, Francesco Nex, Hao Cheng, Hesheng Wang,
- Abstract要約: TopoLiDMは、高忠実度LiDAR生成のためのトポロジカル正規化の下で、グラフニューラルネットワークと拡散モデルを統合する新しいフレームワークである。
我々のアプローチはまず、グラフ構造と複数のグラフ畳み込み層によって潜在グラフ表現を抽出するために、位相保存型VAEを訓練する。
KITTI-360データセットの大規模な実験は、最先端の手法よりもTopoLiDMの方が優れていることを示している。
- 参考スコア(独自算出の注目度): 15.223634903890863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR scene generation is critical for mitigating real-world LiDAR data collection costs and enhancing the robustness of downstream perception tasks in autonomous driving. However, existing methods commonly struggle to capture geometric realism and global topological consistency. Recent LiDAR Diffusion Models (LiDMs) predominantly embed LiDAR points into the latent space for improved generation efficiency, which limits their interpretable ability to model detailed geometric structures and preserve global topological consistency. To address these challenges, we propose TopoLiDM, a novel framework that integrates graph neural networks (GNNs) with diffusion models under topological regularization for high-fidelity LiDAR generation. Our approach first trains a topological-preserving VAE to extract latent graph representations by graph construction and multiple graph convolutional layers. Then we freeze the VAE and generate novel latent topological graphs through the latent diffusion models. We also introduce 0-dimensional persistent homology (PH) constraints, ensuring the generated LiDAR scenes adhere to real-world global topological structures. Extensive experiments on the KITTI-360 dataset demonstrate TopoLiDM's superiority over state-of-the-art methods, achieving improvements of 22.6% lower Frechet Range Image Distance (FRID) and 9.2% lower Minimum Matching Distance (MMD). Notably, our model also enables fast generation speed with an average inference time of 1.68 samples/s, showcasing its scalability for real-world applications. We will release the related codes at https://github.com/IRMVLab/TopoLiDM.
- Abstract(参考訳): LiDARシーン生成は、現実のLiDARデータ収集コストを軽減し、自動運転における下流認識タスクの堅牢性を高めるために重要である。
しかし、既存の手法は、幾何学的リアリズムと大域的位相的一貫性を捉えるのによく苦労する。
近年のLiDAR拡散モデル(LiDM)は、LiDARの点を潜在空間に埋め込んで生成効率を向上させる。
これらの課題に対処するために,高忠実度LiDAR生成のためのトポロジカル正規化の下でグラフニューラルネットワーク(GNN)と拡散モデルを統合する新しいフレームワークであるTopoLiDMを提案する。
我々のアプローチはまず、グラフ構造と複数のグラフ畳み込み層によって潜在グラフ表現を抽出するために、位相保存型VAEを訓練する。
次に、VAEを凍結し、潜伏拡散モデルを通して新しい潜伏トポロジーグラフを生成する。
また、0次元持続ホモロジー(PH)制約を導入し、生成されたLiDARシーンが現実世界のグローバルなトポロジ構造に忠実であることを保証する。
KITTI-360データセットの大規模な実験では、TopoLiDMが最先端の手法よりも優れていることが示され、22.6%のFrechet Range Image Distance(FRID)、9.2%のMinimum Matching Distance(MMD)が改善された。
特に,本モデルでは,実世界のアプリケーションにおいて,平均1.68サンプル/秒で高速な生成速度を実現する。
関連コードはhttps://github.com/IRMVLab/TopoLiDM.comで公開します。
関連論文リスト
- SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation [10.77777607732642]
Spiralは、深度、反射率の画像、セマンティックマップを同時に生成する新しいレンジビューLiDAR拡散モデルである。
Semantic KITTIとnuScenesデータセットの実験は、Spralが最小のパラメータサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-28T17:55:35Z) - SeaDAG: Semi-autoregressive Diffusion for Conditional Directed Acyclic Graph Generation [83.52157311471693]
方向性非巡回グラフ(DAG)の条件生成のための半自己回帰拡散モデルSeaDAGを紹介する。
グローバルグラフ構造を欠いた従来の自己回帰生成とは異なり,本手法は拡散ステップ毎に完全なグラフ構造を保持する。
本研究では,現実的なDAGを生成する拡散モデルの能力を高めるために,条件損失を伴うグラフ条件学習を明示的に訓練する。
論文 参考訳(メタデータ) (2024-10-21T15:47:03Z) - LiDAR-GS:Real-time LiDAR Re-Simulation using Gaussian Splatting [50.808933338389686]
都市景観におけるLiDARスキャンをリアルタイムかつ高忠実に再現するLiDAR-GSを提案する。
この手法は,公開可能な大規模シーンデータセットのレンダリングフレームレートと品質の両面において,最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-07T15:07:56Z) - RangeLDM: Fast Realistic LiDAR Point Cloud Generation [12.868053836790194]
本研究では,高品質なLiDAR点雲を高速に生成するための新しいアプローチであるRangeLDMを紹介する。
Hough 投票による点雲から範囲画像への正確な投影のために、レンジビューデータ分布を補正することで、これを実現する。
我々は、レンジ誘導型識別器を考案し、3次元構造的忠実性を維持するようモデルに指示する。
論文 参考訳(メタデータ) (2024-03-15T08:19:57Z) - LiDAR Data Synthesis with Denoising Diffusion Probabilistic Models [1.1965844936801797]
3D LiDARデータの生成モデリングは、自律移動ロボットに有望な応用をもたらす新たな課題である。
我々は,多種多様かつ高忠実な3Dシーンポイント雲を生成可能な,LiDARデータのための新しい生成モデルR2DMを提案する。
本手法は拡散確率モデル (DDPM) を用いて構築され, 生成モデルフレームワークにおいて顕著な結果が得られた。
論文 参考訳(メタデータ) (2023-09-17T12:26:57Z) - SEGNO: Generalizing Equivariant Graph Neural Networks with Physical
Inductive Biases [66.61789780666727]
等変性を維持しながら, 2階連続性をGNNに組み込む方法を示す。
また、SEGNOに関する理論的知見も提供し、隣接する状態間の一意の軌跡を学習できることを強調している。
我々のモデルは最先端のベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-08-25T07:15:58Z) - LiDAR-NeRF: Novel LiDAR View Synthesis via Neural Radiance Fields [112.62936571539232]
本稿では,LiDARセンサのための新しいビュー合成手法を提案する。
スタイルトランスファーニューラルネットワークを用いた従来のモデルベースLiDARシミュレータは、新しいビューのレンダリングに応用できる。
ニューラル放射場(NeRF)を用いて幾何学と3D点の属性の連成学習を容易にする。
論文 参考訳(メタデータ) (2023-04-20T15:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。