論文の概要: Reflectance Prediction-based Knowledge Distillation for Robust 3D Object Detection in Compressed Point Clouds
- arxiv url: http://arxiv.org/abs/2505.17442v1
- Date: Fri, 23 May 2025 03:52:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.800689
- Title: Reflectance Prediction-based Knowledge Distillation for Robust 3D Object Detection in Compressed Point Clouds
- Title(参考訳): 反射率予測に基づく圧縮点雲中のロバスト3次元物体検出のための知識蒸留
- Authors: Hao Jing, Anhong Wang, Yifan Zhang, Donghan Bu, Junhui Hou,
- Abstract要約: 本稿では,反射率予測に基づく知識蒸留(RPKD)を用いた3次元物体検出フレームワークを提案する。
我々は、低ビットレート伝送中に反射率をなくしながら点座標を圧縮し、デコードされた非反射性圧縮点雲を学生検出器に供給する。
複数のコードレートで圧縮点雲の検出精度を向上させることができる。
- 参考スコア(独自算出の注目度): 45.694869892846945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Regarding intelligent transportation systems for vehicle networking, low-bitrate transmission via lossy point cloud compression is vital for facilitating real-time collaborative perception among vehicles with restricted bandwidth. In existing compression transmission systems, the sender lossily compresses point coordinates and reflectance to generate a transmission code stream, which faces transmission burdens from reflectance encoding and limited detection robustness due to information loss. To address these issues, this paper proposes a 3D object detection framework with reflectance prediction-based knowledge distillation (RPKD). We compress point coordinates while discarding reflectance during low-bitrate transmission, and feed the decoded non-reflectance compressed point clouds into a student detector. The discarded reflectance is then reconstructed by a geometry-based reflectance prediction (RP) module within the student detector for precise detection. A teacher detector with the same structure as student detector is designed for performing reflectance knowledge distillation (RKD) and detection knowledge distillation (DKD) from raw to compressed point clouds. Our RPKD framework jointly trains detectors on both raw and compressed point clouds to improve the student detector's robustness. Experimental results on the KITTI dataset and Waymo Open Dataset demonstrate that our method can boost detection accuracy for compressed point clouds across multiple code rates. Notably, at a low code rate of 2.146 Bpp on the KITTI dataset, our RPKD-PV achieves the highest mAP of 73.6, outperforming existing detection methods with the PV-RCNN baseline.
- Abstract(参考訳): 車両ネットワークのためのインテリジェントトランスポートシステムでは、損失点クラウド圧縮による低ビットレート伝送は、帯域制限のある車両間でリアルタイムの協調認識を促進するために不可欠である。
既存の圧縮伝送システムでは、送信者はポイント座標とリフレクタンスを損失的に圧縮して送信コードストリームを生成し、リフレクタンス符号化による送信負荷と情報損失による検出ロバスト性に直面する。
本稿では, 反射率予測に基づく知識蒸留(RPKD)を用いた3次元物体検出フレームワークを提案する。
我々は、低ビットレート伝送中に反射率をなくしながら点座標を圧縮し、デコードされた非反射性圧縮点雲を学生検出器に供給する。
捨てられた反射は、精密検出のために学生検出器内の幾何ベースの反射率予測(RP)モジュールによって再構成される。
生から圧縮された点雲から反射性知識蒸留(RKD)および検出性知識蒸留(DKD)を行うために、学生検出器と同じ構造を持つ教師検出器を設計する。
我々のRPKDフレームワークは、生雲と圧縮点雲の両方で検出器を共同で訓練し、学生検出器の堅牢性を向上させる。
KITTIデータセットとWaymo Open Datasetの実験結果から,圧縮点雲の検出精度を複数のコードレートで向上できることが示された。
特に、KITTIデータセット上のコードレート2.146Bppでは、我々のRPKD-PVは73.6のmAPを達成し、PV-RCNNベースラインでの既存の検出方法よりも優れています。
関連論文リスト
- ROI-Guided Point Cloud Geometry Compression Towards Human and Machine Vision [0.0]
本研究では,人間と機械の視界に対する新しい関心誘導ポイントクラウド幾何圧縮法(RPCGC)を提案する。
我々のフレームワークはデュアルブランチ並列構造を用いており、ベース層はポイントクラウドの簡易バージョンをエンコードしデコードする。
我々はこれらのマスクの詳細を、各点を歪み計算で重み付けしたRD(Rate-Distortion)最適化プロセスに適用する。
論文 参考訳(メタデータ) (2025-04-19T09:31:37Z) - Poster: Making Edge-assisted LiDAR Perceptions Robust to Lossy Point
Cloud Compression [0.0]
損失圧縮による知覚性能損失を軽減するため,LiDAR点雲の品質を向上するアルゴリズムを提案する。
既存の画像アルゴリズムと比較して,距離画像から点雲を再構成した場合の定性的な結果が得られた。
論文 参考訳(メタデータ) (2023-09-08T18:34:48Z) - Semantic Segmentation of Radar Detections using Convolutions on Point
Clouds [59.45414406974091]
本稿では,レーダ検出を点雲に展開する深層学習手法を提案する。
このアルゴリズムは、距離依存クラスタリングと入力点雲の事前処理により、レーダ固有の特性に適応する。
我々のネットワークは、レーダポイント雲のセマンティックセグメンテーションのタスクにおいて、PointNet++に基づく最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-05-22T07:09:35Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。
このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。
nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-30T01:44:30Z) - itKD: Interchange Transfer-based Knowledge Distillation for 3D Object
Detection [3.735965959270874]
本稿では,チャネルワイド圧縮と非圧縮を含むオートエンコーダスタイルのフレームワークを提案する。
教師ネットワークのマップビュー特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して渡される。
マルチヘッド自己認識機構によって引き起こされた3次元物体検出情報と一致するように,頭部の注意損失を示す。
論文 参考訳(メタデータ) (2022-05-31T04:25:37Z) - R-AGNO-RPN: A LIDAR-Camera Region Deep Network for Resolution-Agnostic
Detection [3.4761212729163313]
3次元点雲とRGB画像を融合した領域提案ネットワークR-AGNO-RPNを提案する。
私たちのアプローチは、低点のクラウド解像度にも適用できるように設計されています。
論文 参考訳(メタデータ) (2020-12-10T15:22:58Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。