論文の概要: itKD: Interchange Transfer-based Knowledge Distillation for 3D Object
Detection
- arxiv url: http://arxiv.org/abs/2205.15531v1
- Date: Tue, 31 May 2022 04:25:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-02 02:52:44.810632
- Title: itKD: Interchange Transfer-based Knowledge Distillation for 3D Object
Detection
- Title(参考訳): itKD:3Dオブジェクト検出のためのインターチェンジ転送に基づく知識蒸留
- Authors: Hyeon Cho, Junyong Choi, Geonwoo Baek, Wonjun Hwang
- Abstract要約: 本稿では,知識蒸留のための交換変換によるチャネルワイド圧縮と圧縮を含むオートエンコーダスタイルのフレームワークを提案する。
教師ネットワークのマップビュー特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して渡される。
マルチヘッド自己認識機構によって引き起こされた方向検出情報に一致した注意的頭部損失を示す。
- 参考スコア(独自算出の注目度): 3.735965959270874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, point-cloud based 3D object detectors have achieved remarkable
progress. However, most studies are limited to the development of deep learning
architectures for improving only their accuracy. In this paper, we propose an
autoencoder-style framework comprising channel-wise compression and
decompression via interchange transfer for knowledge distillation. To learn the
map-view feature of a teacher network, the features from a teacher and student
network are independently passed through the shared autoencoder; here, we use a
compressed representation loss that binds the channel-wised compression
knowledge from both the networks as a kind of regularization. The decompressed
features are transferred in opposite directions to reduce the gap in the
interchange reconstructions. Lastly, we present an attentive head loss for
matching the pivotal detection information drawn by the multi-head
self-attention mechanism. Through extensive experiments, we verify that our
method can learn the lightweight model that is well-aligned with the 3D point
cloud detection task and we demonstrate its superiority using the well-known
public datasets Waymo and nuScenes.
- Abstract(参考訳): 近年,点雲型3次元物体検出器は目覚ましい進歩を遂げている。
しかし、ほとんどの研究は、精度向上のため、ディープラーニングアーキテクチャの開発に限定されている。
本稿では,知識蒸留のための交換転送によるチャネル回り圧縮と減圧縮からなるオートエンコーダ方式のフレームワークを提案する。
教師ネットワークのmap-view特徴を学習するために、教師と学生ネットワークからの機能は、共用オートエンコーダを介して独立に受け継がれ、ここでは、両ネットワークからのチャネル毎の圧縮知識を正規化の一種として、圧縮表現損失を用いる。
減圧された特徴は、交換再構成のギャップを減らすために反対方向に伝達される。
最後に,マルチヘッド自己認識機構によって引き起こされる位置検出情報に一致する注意的頭部損失を示す。
広範にわたる実験により,本手法が3Dポイントクラウド検出タスクとよく整合した軽量モデルを学習できることを確認し,その優位性をWaymoとnuScenesを用いて実証した。
関連論文リスト
- Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - Self-Ensemling for 3D Point Cloud Domain Adaption [29.330315360307374]
本稿では,3次元クラウド領域適応タスクのためのエンドツーエンドの自己組織化ネットワーク(SEN)を提案する。
我々のSENは、平均教師と半教師付き学習の利点を生かし、ソフトな分類損失と一貫性損失を導入している。
我々のSENは、分類タスクとセグメンテーションタスクの両方において最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-12-10T02:18:09Z) - AttDLNet: Attention-based DL Network for 3D LiDAR Place Recognition [0.6352264764099531]
本稿では,AttDLNetという3次元LiDARに基づくディープラーニングネットワークを提案する。
注意機構を利用して、長距離コンテキストと機能間関係に選択的にフォーカスする。
その結果、エンコーダネットワークの機能は、すでに非常に説明力があるが、ネットワークに注意を加えることで、パフォーマンスがさらに向上していることがわかった。
論文 参考訳(メタデータ) (2021-06-17T16:34:37Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。