論文の概要: LiDAR Point Cloud Image-based Generation Using Denoising Diffusion Probabilistic Models
- arxiv url: http://arxiv.org/abs/2509.18917v1
- Date: Tue, 23 Sep 2025 12:35:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.832622
- Title: LiDAR Point Cloud Image-based Generation Using Denoising Diffusion Probabilistic Models
- Title(参考訳): 拡散確率モデルを用いたLiDAR点画像生成
- Authors: Amirhesam Aghanouri, Cristina Olaverri-Monreal,
- Abstract要約: 現実世界のLiDARデータは時間がかかり、悪天候やセンサーの制限によってノイズや空間に影響を受けることが多い。
本研究は, 拡散確率モデル (DDPM) を適用して, 改良のための高品質な合成データを生成する。
- 参考スコア(独自算出の注目度): 0.2809622746998686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles (AVs) are expected to revolutionize transportation by improving efficiency and safety. Their success relies on 3D vision systems that effectively sense the environment and detect traffic agents. Among sensors AVs use to create a comprehensive view of surroundings, LiDAR provides high-resolution depth data enabling accurate object detection, safe navigation, and collision avoidance. However, collecting real-world LiDAR data is time-consuming and often affected by noise and sparsity due to adverse weather or sensor limitations. This work applies a denoising diffusion probabilistic model (DDPM), enhanced with novel noise scheduling and time-step embedding techniques to generate high-quality synthetic data for augmentation, thereby improving performance across a range of computer vision tasks, particularly in AV perception. These modifications impact the denoising process and the model's temporal awareness, allowing it to produce more realistic point clouds based on the projection. The proposed method was extensively evaluated under various configurations using the IAMCV and KITTI-360 datasets, with four performance metrics compared against state-of-the-art (SOTA) methods. The results demonstrate the model's superior performance over most existing baselines and its effectiveness in mitigating the effects of noisy and sparse LiDAR data, producing diverse point clouds with rich spatial relationships and structural detail.
- Abstract(参考訳): 自動運転車(AV)は、効率と安全性を改善して交通機関に革命をもたらすことが期待されている。
彼らの成功は、環境を効果的に感知し、交通機関を検出する3D視覚システムに依存している。
AVが周囲の全体像を作成するために使用するセンサーの中で、LiDARは正確な物体検出、安全なナビゲーション、衝突回避を可能にする高解像度の深度データを提供する。
しかし、現実のLiDARデータの収集には時間がかかり、悪天候やセンサーの制限によるノイズや空間の分散の影響がしばしば発生する。
本研究は,新しいノイズスケジューリングと時間段階埋め込み技術によって拡張された拡散確率モデル(DDPM)を適用し,高品質な合成データを生成することにより,特にAV知覚において,コンピュータビジョンタスクの幅広い性能を向上させる。
これらの修正はデノナイジングプロセスとモデルの時間的認識に影響を与え、プロジェクションに基づいてより現実的な点雲を生成できる。
提案手法は, IAMCVとKITTI-360データセットを用いて, 最先端(SOTA)手法と比較して4つの性能指標を用いて, 様々な構成で広範囲に評価された。
その結果、モデルが既存のベースラインよりも優れた性能を示し、ノイズやスパースなLiDARデータの影響を緩和し、豊富な空間的関係と構造的詳細を持つ多様な点雲を発生させる効果を示した。
関連論文リスト
- InJecteD: Analyzing Trajectories and Drift Dynamics in Denoising Diffusion Probabilistic Models for 2D Point Cloud Generation [48.55037712252843]
InJecteDは拡散確率モデル(DDPM)を解釈するフレームワーク
このフレームワークをDatasaurus Dozen bullseye, dino, circleの3つのデータセットに適用する。
提案手法は, 変位, 速度, クラスタリング, ドリフト場力学などの軌道特性を定量的に評価する。
論文 参考訳(メタデータ) (2025-09-09T14:53:19Z) - FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。
近年の手法では、レンジビュー表現を利用して処理効率を向上している。
範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文 参考訳(メタデータ) (2025-02-13T12:39:26Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - TripleMixer: A 3D Point Cloud Denoising Model for Adverse Weather [10.564182855472328]
逆気象条件は、LiDARベースの知覚モデルに重大な課題をもたらす。
本稿では,空間,周波数,チャネルワイズ処理を統合したポイントクラウドデノナイズネットワークであるTripleMixerを提案する。
大規模な実験により、TripleMixerは最先端のデノイング性能を達成している。
論文 参考訳(メタデータ) (2024-08-25T10:45:52Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Enhancing Lidar-based Object Detection in Adverse Weather using Offset
Sequences in Time [1.1725016312484975]
ライダーによる物体検出は、雨や霧などの悪天候の影響を著しく受けている。
本研究は,ライダーによる物体検出の信頼性に対する悪天候の影響を緩和する有効な方法の総合的研究である。
論文 参考訳(メタデータ) (2024-01-17T08:31:58Z) - Real-Time Object Detection in Occluded Environment with Background
Cluttering Effects Using Deep Learning [0.8192907805418583]
混在した環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中する。
開発した手法は、カスタムデータセットを作成し、ノイズの多いデータセットをきれいにするために前処理技術を使用する。
SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。
論文 参考訳(メタデータ) (2024-01-02T01:30:03Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。