Fugu-MT 論文翻訳(概要): Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection

論文の概要: Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection

arxiv url: http://arxiv.org/abs/2312.02966v1
Date: Tue, 5 Dec 2023 18:54:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-06 14:32:28.310087
Title: Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection
Title（参考訳）: 拡散SS3D:半教師付き3次元物体検出のための拡散モデル
Authors: Cheng-Ju Ho, Chen-Hsuan Tai, Yen-Yu Lin, Ming-Hsuan Yang, Yi-Hsuan Tsai
Abstract要約: 半教師付き3次元物体検出のための拡散モデルを用いて,擬似ラベルの品質向上に向けた新たな視点であるDiffusion-SS3Dを提案する。具体的には、劣化した3Dオブジェクトサイズとクラスラベル、分布を生成し、拡散モデルをデノナイズプロセスとして利用し、バウンディングボックス出力を得る。我々は,ScanNetとSUN RGB-Dベンチマークデータセットの実験を行い,既存手法に対する最先端性能の実現を実証した。
参考スコア（独自算出の注目度）: 77.23918785277404
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semi-supervised object detection is crucial for 3D scene understanding, efficiently addressing the limitation of acquiring large-scale 3D bounding box annotations. Existing methods typically employ a teacher-student framework with pseudo-labeling to leverage unlabeled point clouds. However, producing reliable pseudo-labels in a diverse 3D space still remains challenging. In this work, we propose Diffusion-SS3D, a new perspective of enhancing the quality of pseudo-labels via the diffusion model for semi-supervised 3D object detection. Specifically, we include noises to produce corrupted 3D object size and class label distributions, and then utilize the diffusion model as a denoising process to obtain bounding box outputs. Moreover, we integrate the diffusion model into the teacher-student framework, so that the denoised bounding boxes can be used to improve pseudo-label generation, as well as the entire semi-supervised learning process. We conduct experiments on the ScanNet and SUN RGB-D benchmark datasets to demonstrate that our approach achieves state-of-the-art performance against existing methods. We also present extensive analysis to understand how our diffusion model design affects performance in semi-supervised learning.
Abstract（参考訳）: 半教師付きオブジェクト検出は,大規模3次元バウンディングボックスアノテーション取得の限界を効率的に解決するため,3次元シーン理解に不可欠である。既存の手法は、通常、未ラベルの点雲を利用するために擬似ラベル付き教師学生フレームワークを使用する。しかし、多様な3d空間で信頼できる擬似ラベルを作ることは依然として困難である。本研究では,半教師付き3次元物体検出のための拡散モデルによる擬似ラベルの品質向上のための新しい視点である diffusion-ss3d を提案する。具体的には、劣化した3Dオブジェクトサイズとクラスラベルの分布を生成するノイズを含み、拡散モデルをデノナイズプロセスとして利用して境界ボックス出力を得る。さらに,拡散モデルを教師/学生のフレームワークに統合することにより,擬似ラベル生成の改善や半教師付き学習プロセス全体の改善を図ることができる。我々は,ScanNetとSUN RGB-Dベンチマークデータセットの実験を行い,既存手法に対する最先端性能の実現を実証した。また, 拡散モデル設計が半教師あり学習の性能に与える影響を理解するために, 広範な分析を行った。

関連論文リスト

PointDico: Contrastive 3D Representation Learning Guided by Diffusion Models [5.077352707415241]
textitPointDicoは、生成的モデリングの認知と、知識の蒸留を通じて、相互モーダルなコントラスト学習の両方から学習する。 textitPointDicoは、ScanObjectNNのtextbf94.32%の精度、ShapeNetPartのtextbf86.5%のInst.mIoUといった3D表現学習において、新しい最先端の3D表現学習を実現している。
論文参考訳（メタデータ） (2025-12-09T07:57:56Z)
DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation [49.32104127246474]
DriveGENは、トレーニング不要のテキストから画像への拡散生成である。様々なアウト・オブ・ディストリビューション世代にまたがる正確な3D形状のオブジェクトを一貫して保存する。
論文参考訳（メタデータ） (2025-03-14T06:35:38Z)
A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本研究では,ガウスプレートの拡散モデルであるSplatDiffusionを導入し,単一画像から3次元構造を生成する。既存の方法は決定論的フィードフォワード予測に依存しており、2Dデータからの3D推論の本質的な曖昧さを扱う能力を制限する。
論文参考訳（メタデータ） (2024-12-01T00:29:57Z)
Diff3DETR:Agent-based Diffusion Model for Semi-supervised 3D Object Detection [33.58208166717537]
3次元物体検出は3次元シーンの理解に不可欠である。半教師付き手法の最近の発展は、教師による学習フレームワークを用いて、未ラベルの点群に対する擬似ラベルを生成することにより、この問題を緩和しようとしている。半教師付き3次元物体検出のためのエージェントベース拡散モデル(Diff3DETR)を提案する。
論文参考訳（メタデータ） (2024-08-01T05:04:22Z)
Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文参考訳（メタデータ） (2024-03-26T05:12:18Z)
SC-Diff: 3D Shape Completion with Latent Diffusion Models [4.913210912019975]
本稿では, 形状の完成に最適化された3次元潜在拡散モデルを用いて, 3次元形状完備化手法を提案する。本手法は,空間的コンディショニングとクロスアテンションによる画像ベースコンディショニングを,キャプチャー部分スキャンからの3次元特徴の統合により組み合わせたものである。
論文参考訳（メタデータ） (2024-03-19T06:01:11Z)
Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文参考訳（メタデータ） (2024-01-10T08:56:07Z)
3DifFusionDet: Diffusion Model for 3D Object Detection with Robust LiDAR-Camera Fusion [6.914463996768285]
3DifFusionDetはノイズの多い3Dボックスからターゲットボックスへのノイズ拡散プロセスとして3Dオブジェクトを検出する。特徴整合戦略の下では、プログレッシブ改良法はロバストLiDAR-Camera融合に重要な貢献をする可能性がある。実世界の交通物体識別のベンチマークであるKITTIの実験では、3DifFusionDetが以前のよく検討された検出器と比較して好適に動作できることが判明した。
論文参考訳（メタデータ） (2023-11-07T05:53:09Z)
Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文参考訳（メタデータ） (2023-09-05T08:49:53Z)
Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。 Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文参考訳（メタデータ） (2022-07-26T04:54:03Z)
SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文参考訳（メタデータ） (2019-12-26T08:48:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。