論文の概要: Point-to-Voxel Knowledge Distillation for LiDAR Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2206.02099v1
- Date: Sun, 5 Jun 2022 05:28:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-07 16:21:24.414436
- Title: Point-to-Voxel Knowledge Distillation for LiDAR Semantic Segmentation
- Title(参考訳): LiDARセマンティックセグメンテーションのためのポイント・ツー・ボクセル知識蒸留法
- Authors: Yuenan Hou, Xinge Zhu, Yuexin Ma, Chen Change Loy, and Yikang Li
- Abstract要約: 本稿では,大きな教師モデルから,LiDARセマンティックセグメンテーションのためのスリムな学生ネットワークへの知識の抽出の問題に対処する。
本稿では,点レベルとボクセルレベルの両方から隠れた知識を伝達するPVDを提案する。
- 参考スコア(独自算出の注目度): 74.67594286008317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article addresses the problem of distilling knowledge from a large
teacher model to a slim student network for LiDAR semantic segmentation.
Directly employing previous distillation approaches yields inferior results due
to the intrinsic challenges of point cloud, i.e., sparsity, randomness and
varying density. To tackle the aforementioned problems, we propose the
Point-to-Voxel Knowledge Distillation (PVD), which transfers the hidden
knowledge from both point level and voxel level. Specifically, we first
leverage both the pointwise and voxelwise output distillation to complement the
sparse supervision signals. Then, to better exploit the structural information,
we divide the whole point cloud into several supervoxels and design a
difficulty-aware sampling strategy to more frequently sample supervoxels
containing less-frequent classes and faraway objects. On these supervoxels, we
propose inter-point and inter-voxel affinity distillation, where the similarity
information between points and voxels can help the student model better capture
the structural information of the surrounding environment. We conduct extensive
experiments on two popular LiDAR segmentation benchmarks, i.e., nuScenes and
SemanticKITTI. On both benchmarks, our PVD consistently outperforms previous
distillation approaches by a large margin on three representative backbones,
i.e., Cylinder3D, SPVNAS and MinkowskiNet. Notably, on the challenging nuScenes
and SemanticKITTI datasets, our method can achieve roughly 75% MACs reduction
and 2x speedup on the competitive Cylinder3D model and rank 1st on the
SemanticKITTI leaderboard among all published algorithms. Our code is available
at https://github.com/cardwing/Codes-for-PVKD.
- Abstract(参考訳): 本稿では,大きな教師モデルから,LiDARセマンティックセグメンテーションのためのスリムな学生ネットワークへの知識の抽出の問題に対処する。
以前の蒸留アプローチを直接使用すると、点雲の本質的な問題、すなわちスパーシティ、ランダム性、密度の変化により、結果が劣る。
本稿では,上記の問題に対処するために,隠れた知識を点レベルとボクセルレベルの両方から伝達するPVD(Point-to-Voxel Knowledge Distillation)を提案する。
具体的には,まず,ポイントワイズ蒸留とボクセルワイズ蒸留を併用し,スパース監視信号を補完する。
そして, 構造情報をよりよく活用するために, 点群全体を複数のスーパーボクセルに分割し, より頻度の低いクラスや遠方オブジェクトを含むスーパーボクセルをサンプリングする難易度の高いサンプリング戦略を設計する。
これらのスーパーボクセル上では, 点とボクセルの類似性情報により, 周辺環境の構造情報をよりよく把握できる点間親和性蒸留法を提案する。
我々は2つの人気のあるLiDARセグメンテーションベンチマーク、すなわちnuScenesとSemanticKITTIで広範囲にわたる実験を行った。
いずれのベンチマークにおいても,我々のpvdは,シリンダー3d,spvnas,minkowskinetという3つの代表的なバックボーンに対して,従来の蒸留アプローチを大きく上回っている。
特に、難易度の高いnuScenesとSemanticKITTIデータセットでは、競合するCylinder3Dモデルで約75%のMAC削減と2倍の高速化を実現し、SemanticKITTIリーダーボードで上位1位となる。
私たちのコードはhttps://github.com/cardwing/Codes-for-PVKDで利用可能です。
関連論文リスト
- Self-Supervised Scene Flow Estimation with Point-Voxel Fusion and Surface Representation [30.355128117680444]
シーンフロー推定は、点雲の2つの連続するフレーム間の点の3次元運動場を生成することを目的としている。
既存の点ベースの手法は点雲の不規則性を無視し、長距離依存を捉えるのが困難である。
本稿では,分散グリッドアテンションとシフトウインドウ戦略に基づくボクセルブランチを用いて,長距離依存性を捕捉するポイントボクセル融合法を提案する。
論文 参考訳(メタデータ) (2024-10-17T09:05:15Z) - LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual
Semantic Segmentation for Autonomous Driving [26.319489913682574]
本稿では,ロジット蒸留と特徴蒸留の両面に新たな貢献をし,Learning to Infuse "X" (LIX) フレームワークを紹介した。
本稿では,2つの技術ノベルティを含む適応的な特徴蒸留アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-13T03:24:36Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Joint Learning for Scattered Point Cloud Understanding with Hierarchical Self-Distillation [34.26170741722835]
そこで本研究では,部分点雲を高速に補正し,同定するエンド・ツー・エンドアーキテクチャを提案する。
階層型自己蒸留(HSD)は任意の階層ベースの点雲法に適用できる。
論文 参考訳(メタデータ) (2023-12-28T08:51:04Z) - Clustering based Point Cloud Representation Learning for 3D Analysis [80.88995099442374]
本稿では,ポイントクラウド分析のためのクラスタリングに基づく教師付き学習手法を提案する。
現在のデファクトでシーンワイドなトレーニングパラダイムとは異なり、我々のアルゴリズムは点埋め込み空間上でクラス内のクラスタリングを行う。
我々のアルゴリズムは、有名なポイントクラウドセグメンテーションデータセットの顕著な改善を示している。
論文 参考訳(メタデータ) (2023-07-27T03:42:12Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Multi-to-Single Knowledge Distillation for Point Cloud Semantic
Segmentation [41.02741249858771]
本稿では,3Dポイントクラウドセマンティックセマンティックセグメンテーションタスクのための多種間知識蒸留フレームワークを提案する。
マルチスキャンのすべてのポイントを直接フューズする代わりに、以前に定義されたハードクラスに属するインスタンスだけが融合する。
論文 参考訳(メタデータ) (2023-04-28T12:17:08Z) - Point2Vec for Self-Supervised Representation Learning on Point Clouds [66.53955515020053]
Data2vecをポイントクラウド領域に拡張し、いくつかのダウンストリームタスクで推奨される結果を報告します。
我々は、ポイントクラウド上でData2vecライクな事前トレーニングの可能性を解放するpoint2vecを提案する。
論文 参考訳(メタデータ) (2023-03-29T10:08:29Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。