論文の概要: GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection
- arxiv url: http://arxiv.org/abs/2503.08639v1
- Date: Tue, 11 Mar 2025 17:29:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:42:26.507854
- Title: GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection
- Title(参考訳): GBlobs: クロスドメインLiDARを用いた3Dオブジェクト検出のためのガウスブロブによる局所構造抽出
- Authors: Dušan Malić, Christian Fruhwirth-Reisinger, Samuel Schulter, Horst Possegger,
- Abstract要約: ドメイン一般化は、そのようなドメインシフトに不変な検出器を訓練することによってこれを緩和することを目的としている。
本稿では,特にガウスブロブ(GBlob)で点雲近傍を符号化することで,DGの明示的な局所点雲構造を利用することを提案する。
提案する定式化は極めて効率的であり,追加のパラメータを必要としない。
- 参考スコア(独自算出の注目度): 12.282805218676208
- License:
- Abstract: LiDAR-based 3D detectors need large datasets for training, yet they struggle to generalize to novel domains. Domain Generalization (DG) aims to mitigate this by training detectors that are invariant to such domain shifts. Current DG approaches exclusively rely on global geometric features (point cloud Cartesian coordinates) as input features. Over-reliance on these global geometric features can, however, cause 3D detectors to prioritize object location and absolute position, resulting in poor cross-domain performance. To mitigate this, we propose to exploit explicit local point cloud structure for DG, in particular by encoding point cloud neighborhoods with Gaussian blobs, GBlobs. Our proposed formulation is highly efficient and requires no additional parameters. Without any bells and whistles, simply by integrating GBlobs in existing detectors, we beat the current state-of-the-art in challenging single-source DG benchmarks by over 21 mAP (Waymo->KITTI), 13 mAP (KITTI->Waymo), and 12 mAP (nuScenes->KITTI), without sacrificing in-domain performance. Additionally, GBlobs demonstrate exceptional performance in multi-source DG, surpassing the current state-of-the-art by 17, 12, and 5 mAP on Waymo, KITTI, and ONCE, respectively.
- Abstract(参考訳): LiDARベースの3D検出器は、トレーニングのために大きなデータセットを必要とするが、新しいドメインへの一般化には苦労している。
ドメイン一般化(DG)は、そのようなドメインシフトに不変な検出器を訓練することによってこれを緩和することを目的としている。
現在のDGアプローチは、入力特徴としてグローバル幾何学的特徴(ポイント・クラウド・カルテシアン座標)にのみ依存している。
しかし、これらのグローバルな幾何学的特徴への過度な依存は、3D検出器が物体の位置と絶対位置を優先させ、結果としてドメイン間の性能が低下する可能性がある。
これを緩和するために,特にガウスブロブ,GBlobで点雲近傍を符号化することで,DGの明示的な局所点雲構造を利用する方法を提案する。
提案する定式化は極めて効率的であり,追加のパラメータを必要としない。
既存の検出器にGBlobを統合するだけで、21mAP(Waymo->KITTI)、13mAP(KITTI->Waymo)、12mAP(nuScenes->KITTI)の挑戦的な単一ソースDGベンチマークにおいて、ドメイン内のパフォーマンスを犠牲にすることなく、現在の最先端のDGベンチマークを破ることができます。
さらに、GBlobsはマルチソースDGにおいて、それぞれWaymo、KITTI、ONCEで現在の最先端の17、12、および5mAPを上回る優れたパフォーマンスを示している。
関連論文リスト
- PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.00221501105788]
領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。
本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。
本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文 参考訳(メタデータ) (2024-08-24T12:53:48Z) - Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.56744870106124]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。
Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。
DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文 参考訳(メタデータ) (2024-07-10T11:11:36Z) - Gaussian Splatting with Localized Points Management [52.009874685460694]
局所的点管理(LPM)は、点加算と幾何校正の双方の最も高い需要において、これらの誤り貢献ゾーンを特定することができる。
LPMは特定ゾーンに点密度を適用し、これらの領域の前に位置する点の不透明度をリセットし、不条件点を補正する新たな機会を創出する。
特に、LPMはバニラ3DGSとSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文 参考訳(メタデータ) (2024-06-06T16:55:07Z) - G-NAS: Generalizable Neural Architecture Search for Single Domain
Generalization Object Detection [55.86838901572496]
微分可能なニューラルネットワークサーチ(NAS)は、複雑なデータフィッティングの能力が高いことで知られている。
一般化可能な損失(G-loss)は、OoDを意識した目的であり、NASが過度に適合することを防ぐ。
S-DGOD都市景観データセットの実験結果から,提案したG-NASはベースライン法と比較してSOTA性能が向上することが示された。
論文 参考訳(メタデータ) (2024-02-07T08:57:59Z) - SUG: Single-dataset Unified Generalization for 3D Point Cloud
Classification [44.27324696068285]
トレーニング済みのソースモデルが直面する予期せぬ領域差を軽減するために,単一データセット統一一般化(SUG)フレームワークを提案する。
具体的には、まず、学習した表現をドメインに依存しない識別性に制約できるマルチグラニュアルサブドメインアライメント(MSA)法を設計する。
次にSDA(Sample-level Domain-Aware Attention)戦略を示し、異なるサブドメインから簡単に適応できるサンプルを選択的に強化する。
論文 参考訳(メタデータ) (2023-05-16T04:36:04Z) - Walking Your LiDOG: A Journey Through Multiple Domains for LiDAR
Semantic Segmentation [16.857861952638498]
We study domain generalization for LiDAR semantic segmentation (DG-LSS)。
その結果,メソッド間の大きなギャップが確認され,ドメイン間設定で評価された。
そこで本研究では,DG-LSSに特化して設計された最初の手法を提案する。
論文 参考訳(メタデータ) (2023-04-23T17:43:29Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - SPG: Unsupervised Domain Adaptation for 3D Object Detection via Semantic
Point Generation [28.372067223801203]
自律走行では、LiDARをベースとした物体検出器は、異なる地理的位置と様々な気象条件下で確実に動作すべきである。
最近の3D検出研究は、単一のドメイン内での性能向上に重点を置いているが、現代の検出器の性能が劇的にクロスドメインに落ちてしまうことは明らかである。
ドメインシフトに対するLiDAR検出器の信頼性を高めるための一般的なアプローチであるセマンティックポイント生成(SPG)を提案する。
論文 参考訳(メタデータ) (2021-08-15T10:00:39Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。