論文の概要: itKD: Interchange Transfer-based Knowledge Distillation for 3D Object
Detection
- arxiv url: http://arxiv.org/abs/2205.15531v2
- Date: Mon, 27 Mar 2023 04:30:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 03:22:43.739538
- Title: itKD: Interchange Transfer-based Knowledge Distillation for 3D Object
Detection
- Title(参考訳): itKD:3Dオブジェクト検出のためのインターチェンジ転送に基づく知識蒸留
- Authors: Hyeon Cho, Junyong Choi, Geonwoo Baek, Wonjun Hwang
- Abstract要約: 本稿では,チャネルワイド圧縮と非圧縮を含むオートエンコーダスタイルのフレームワークを提案する。
教師ネットワークのマップビュー特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して渡される。
マルチヘッド自己認識機構によって引き起こされた3次元物体検出情報と一致するように,頭部の注意損失を示す。
- 参考スコア(独自算出の注目度): 3.735965959270874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Point-cloud based 3D object detectors recently have achieved remarkable
progress. However, most studies are limited to the development of network
architectures for improving only their accuracy without consideration of the
computational efficiency. In this paper, we first propose an autoencoder-style
framework comprising channel-wise compression and decompression via interchange
transfer-based knowledge distillation. To learn the map-view feature of a
teacher network, the features from teacher and student networks are
independently passed through the shared autoencoder; here, we use a compressed
representation loss that binds the channel-wised compression knowledge from
both student and teacher networks as a kind of regularization. The decompressed
features are transferred in opposite directions to reduce the gap in the
interchange reconstructions. Lastly, we present an head attention loss to match
the 3D object detection information drawn by the multi-head self-attention
mechanism. Through extensive experiments, we verify that our method can train
the lightweight model that is well-aligned with the 3D point cloud detection
task and we demonstrate its superiority using the well-known public datasets;
e.g., Waymo and nuScenes.
- Abstract(参考訳): ポイントクラウドベースの3Dオブジェクト検出器は、最近顕著な進歩を遂げた。
しかし、ほとんどの研究は計算効率を考慮せずに精度だけを改善するネットワークアーキテクチャの開発に限定されている。
本稿では,まず,交換転送型知識蒸留によるチャネル回り圧縮と減圧縮からなるオートエンコーダ方式のフレームワークを提案する。
教師ネットワークのマップビューの特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して受け継がれ、ここでは、学生ネットワークと教師ネットワークの両方からのチャネルワイド圧縮知識を一種の正規化として結合する圧縮表現損失を使用する。
減圧された特徴は、交換再構成のギャップを減らすために反対方向に伝達される。
最後に,マルチヘッド自己認識機構によって引き起こされた3次元物体検出情報に適合する頭部注意損失を示す。
広範にわたる実験を通じて,本手法が3Dポイントクラウド検出タスクに適合した軽量モデルをトレーニングできることを確認し,その優位性をよく知られた公開データセット(WaymoやnuScenesなど)を用いて示す。
関連論文リスト
- Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - Self-Ensemling for 3D Point Cloud Domain Adaption [29.330315360307374]
本稿では,3次元クラウド領域適応タスクのためのエンドツーエンドの自己組織化ネットワーク(SEN)を提案する。
我々のSENは、平均教師と半教師付き学習の利点を生かし、ソフトな分類損失と一貫性損失を導入している。
我々のSENは、分類タスクとセグメンテーションタスクの両方において最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-12-10T02:18:09Z) - AttDLNet: Attention-based DL Network for 3D LiDAR Place Recognition [0.6352264764099531]
本稿では,AttDLNetという3次元LiDARに基づくディープラーニングネットワークを提案する。
注意機構を利用して、長距離コンテキストと機能間関係に選択的にフォーカスする。
その結果、エンコーダネットワークの機能は、すでに非常に説明力があるが、ネットワークに注意を加えることで、パフォーマンスがさらに向上していることがわかった。
論文 参考訳(メタデータ) (2021-06-17T16:34:37Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。