論文の概要: PointDiffuse: A Dual-Conditional Diffusion Model for Enhanced Point Cloud Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2503.06094v1
- Date: Sat, 08 Mar 2025 06:53:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:49:28.022683
- Title: PointDiffuse: A Dual-Conditional Diffusion Model for Enhanced Point Cloud Semantic Segmentation
- Title(参考訳): PointDiffuse: 強化されたポイントクラウドセマンティックセマンティックセグメンテーションのためのデュアルコンディション拡散モデル
- Authors: Yong He, Hongshan Yu, Mingtao Feng, Tongjia Chen, Zechuan Li, Anwaar Ulhaq, Saeed Anwar, Ajmal Saeed Mian,
- Abstract要約: 拡散モデルを拡張し、点位置を固定し、拡散モデルは色の代わりに点ラベルを生成する。
提案した2つの条件付き拡散モデルベースネットワーク(PointDiffuse)にノイズラベル埋め込み,ポイント周波数変換器,およびノードをデノベートすることで,大規模ポイントクラウドセマンティックセマンティックセマンティクスを実現する。
- 参考スコア(独自算出の注目度): 22.944385071108716
- License:
- Abstract: Diffusion probabilistic models are traditionally used to generate colors at fixed pixel positions in 2D images. Building on this, we extend diffusion models to point cloud semantic segmentation, where point positions also remain fixed, and the diffusion model generates point labels instead of colors. To accelerate the denoising process in reverse diffusion, we introduce a noisy label embedding mechanism. This approach integrates semantic information into the noisy label, providing an initial semantic reference that improves the reverse diffusion efficiency. Additionally, we propose a point frequency transformer that enhances the adjustment of high-level context in point clouds. To reduce computational complexity, we introduce the position condition into MLP and propose denoising PointNet to process the high-resolution point cloud without sacrificing geometric details. Finally, we integrate the proposed noisy label embedding, point frequency transformer and denoising PointNet in our proposed dual conditional diffusion model-based network (PointDiffuse) to perform large-scale point cloud semantic segmentation. Extensive experiments on five benchmarks demonstrate the superiority of PointDiffuse, achieving the state-of-the-art mIoU of 74.2\% on S3DIS Area 5, 81.2\% on S3DIS 6-fold and 64.8\% on SWAN dataset.
- Abstract(参考訳): 拡散確率モデルは伝統的に2次元画像の固定されたピクセル位置で色を生成するために使用される。
これに基づいて拡散モデルを拡張し、点位置も固定され、拡散モデルは色の代わりに点ラベルを生成する。
逆拡散における雑音発生過程を高速化するために,雑音ラベル埋め込み機構を導入する。
このアプローチは意味情報をノイズラベルに統合し、逆拡散効率を向上させる最初の意味参照を提供する。
さらに,点雲における高次文脈の調整を強化する点周波数変換器を提案する。
計算複雑性を低減するため、位置条件をMPPに導入し、幾何学的詳細を犠牲にすることなく、高解像度の点雲を処理できるポイントネットを提案する。
最後に,提案した2つの条件付き拡散モデルベースネットワーク(PointDiffuse)に雑音ラベル埋め込み,点周波数変換器,およびポイントネットを組み込むことにより,大規模ポイントクラウドセマンティックセマンティックセマンティクスを実現する。
5つのベンチマークによる大規模な実験は、S3DISエリア5, 81.2\%、SWANデータセット64.8\%で74.2\%の最先端mIoUを達成し、PointDiffuseの優位性を実証している。
関連論文リスト
- Diffusion-Occ: 3D Point Cloud Completion via Occupancy Diffusion [5.189790379672664]
拡散点クラウドコンプリートのための新しいフレームワークである textbfDiffusion-Occ を紹介する。
占有領域をしきい値にすることで、それを完全点雲に変換する。
実験の結果,Diffusion-Occは既存の差別的・生成的手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-27T07:57:58Z) - Multiway Point Cloud Mosaicking with Diffusion and Global Optimization [74.3802812773891]
マルチウェイポイントクラウドモザイクのための新しいフレームワーク(水曜日)を紹介する。
我々のアプローチの核心は、重複を識別し、注意点を洗練する学習されたペアワイズ登録アルゴリズムODINである。
4つの多種多様な大規模データセットを用いて、我々の手法は、全てのベンチマークにおいて大きなマージンで、最先端のペアとローテーションの登録結果を比較した。
論文 参考訳(メタデータ) (2024-03-30T17:29:13Z) - Point Cloud Pre-training with Diffusion Models [62.12279263217138]
我々は、ポイントクラウド拡散事前学習(PointDif)と呼ばれる新しい事前学習手法を提案する。
PointDifは、分類、セグメンテーション、検出など、さまざまな下流タスクのために、さまざまな現実世界のデータセット間で大幅に改善されている。
論文 参考訳(メタデータ) (2023-11-25T08:10:05Z) - SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D
Object Pose Estimation [66.16525145765604]
実世界のシナリオにおける6次元オブジェクトポーズ推定のためのSE(3)拡散モデルに基づく点クラウド登録フレームワークを提案する。
提案手法は,3次元登録タスクをデノナイズ拡散過程として定式化し,音源雲の姿勢を段階的に洗練する。
実世界のTUD-L, LINEMOD, およびOccluded-LINEMODデータセットにおいて, 拡散登録フレームワークが顕著なポーズ推定性能を示すことを示す。
論文 参考訳(メタデータ) (2023-10-26T12:47:26Z) - TransUPR: A Transformer-based Uncertain Point Refiner for LiDAR Point
Cloud Semantic Segmentation [6.587305905804226]
本稿ではトランスUPR(Transformer-based certain point refiner)を提案する。
我々のTransUPRは最先端のパフォーマンス、すなわちSemantic KITTIベンチマーク上の68.2%のIntersection over Union(mIoU)を達成する。
論文 参考訳(メタデータ) (2023-02-16T21:38:36Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z) - PUFA-GAN: A Frequency-Aware Generative Adversarial Network for 3D Point
Cloud Upsampling [56.463507980857216]
本稿では,点群アップサンプリングのための生成的対向ネットワークを提案する。
基底表面に均等に分布するアップサンプリングポイントを作成できるだけでなく、クリーンな高周波領域を効率的に生成することができる。
論文 参考訳(メタデータ) (2022-03-02T07:47:46Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Spherical Interpolated Convolutional Network with Distance-Feature
Density for 3D Semantic Segmentation of Point Clouds [24.85151376535356]
従来のグリッド形状の3次元畳み込み演算子を置き換えるために,球面補間畳み込み演算子を提案する。
提案手法は,ScanNetデータセットとParis-Lille-3Dデータセットで良好な性能を示す。
論文 参考訳(メタデータ) (2020-11-27T15:35:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。