Fugu-MT 論文翻訳(概要): itKD: Interchange Transfer-based Knowledge Distillation for 3D Object Detection

論文の概要: itKD: Interchange Transfer-based Knowledge Distillation for 3D Object Detection

arxiv url: http://arxiv.org/abs/2205.15531v2
Date: Mon, 27 Mar 2023 04:30:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-29 03:22:43.739538
Title: itKD: Interchange Transfer-based Knowledge Distillation for 3D Object Detection
Title（参考訳）: itKD:3Dオブジェクト検出のためのインターチェンジ転送に基づく知識蒸留
Authors: Hyeon Cho, Junyong Choi, Geonwoo Baek, Wonjun Hwang
Abstract要約: 本稿では,チャネルワイド圧縮と非圧縮を含むオートエンコーダスタイルのフレームワークを提案する。教師ネットワークのマップビュー特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して渡される。マルチヘッド自己認識機構によって引き起こされた3次元物体検出情報と一致するように,頭部の注意損失を示す。
参考スコア（独自算出の注目度）: 3.735965959270874
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Point-cloud based 3D object detectors recently have achieved remarkable progress. However, most studies are limited to the development of network architectures for improving only their accuracy without consideration of the computational efficiency. In this paper, we first propose an autoencoder-style framework comprising channel-wise compression and decompression via interchange transfer-based knowledge distillation. To learn the map-view feature of a teacher network, the features from teacher and student networks are independently passed through the shared autoencoder; here, we use a compressed representation loss that binds the channel-wised compression knowledge from both student and teacher networks as a kind of regularization. The decompressed features are transferred in opposite directions to reduce the gap in the interchange reconstructions. Lastly, we present an head attention loss to match the 3D object detection information drawn by the multi-head self-attention mechanism. Through extensive experiments, we verify that our method can train the lightweight model that is well-aligned with the 3D point cloud detection task and we demonstrate its superiority using the well-known public datasets; e.g., Waymo and nuScenes.
Abstract（参考訳）: ポイントクラウドベースの3Dオブジェクト検出器は、最近顕著な進歩を遂げた。しかし、ほとんどの研究は計算効率を考慮せずに精度だけを改善するネットワークアーキテクチャの開発に限定されている。本稿では,まず,交換転送型知識蒸留によるチャネル回り圧縮と減圧縮からなるオートエンコーダ方式のフレームワークを提案する。教師ネットワークのマップビューの特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して受け継がれ、ここでは、学生ネットワークと教師ネットワークの両方からのチャネルワイド圧縮知識を一種の正規化として結合する圧縮表現損失を使用する。減圧された特徴は、交換再構成のギャップを減らすために反対方向に伝達される。最後に,マルチヘッド自己認識機構によって引き起こされた3次元物体検出情報に適合する頭部注意損失を示す。広範にわたる実験を通じて,本手法が3Dポイントクラウド検出タスクに適合した軽量モデルをトレーニングできることを確認し,その優位性をよく知られた公開データセット(WaymoやnuScenesなど)を用いて示す。

関連論文リスト

TransBridge: Boost 3D Object Detection by Scene-Level Completion with Transformer Decoder [66.22997415145467]
本稿では,スパース領域における検出機能を改善する共同補完・検出フレームワークを提案する。具体的には,トランスブリッジ(TransBridge)を提案する。トランスブリッジ(TransBridge)はトランスフォーマーをベースとした新しいアップサンプリングブロックである。その結果,本フレームワークは,各手法の平均精度(mAP)が0.7から1.5の範囲で,エンドツーエンドの3Dオブジェクト検出を一貫して改善していることがわかった。
論文参考訳（メタデータ） (2025-12-12T00:08:03Z)
Reflectance Prediction-based Knowledge Distillation for Robust 3D Object Detection in Compressed Point Clouds [45.694869892846945]
本稿では,反射率予測に基づく知識蒸留(RPKD)を用いた3次元物体検出フレームワークを提案する。我々は、低ビットレート伝送中に反射率をなくしながら点座標を圧縮し、デコードされた非反射性圧縮点雲を学生検出器に供給する。複数のコードレートで圧縮点雲の検出精度を向上させることができる。
論文参考訳（メタデータ） (2025-05-23T03:52:27Z)
Cross-Cluster Shifting for Efficient and Effective 3D Object Detection in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文参考訳（メタデータ） (2024-03-10T10:36:32Z)
Unleash the Potential of Image Branch for Cross-modal 3D Object Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文参考訳（メタデータ） (2023-01-22T08:26:58Z)
ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文参考訳（メタデータ） (2022-12-12T13:10:19Z)
AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文参考訳（メタデータ） (2022-08-24T16:54:38Z)
Paint and Distill: Boosting 3D Object Detection with Semantic Passing Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文参考訳（メタデータ） (2022-07-12T12:35:34Z)
Self-Ensemling for 3D Point Cloud Domain Adaption [29.330315360307374]
本稿では,3次元クラウド領域適応タスクのためのエンドツーエンドの自己組織化ネットワーク(SEN)を提案する。我々のSENは、平均教師と半教師付き学習の利点を生かし、ソフトな分類損失と一貫性損失を導入している。我々のSENは、分類タスクとセグメンテーションタスクの両方において最先端の手法より優れています。
論文参考訳（メタデータ） (2021-12-10T02:18:09Z)
AttDLNet: Attention-based DL Network for 3D LiDAR Place Recognition [0.6352264764099531]
本稿では,AttDLNetという3次元LiDARに基づくディープラーニングネットワークを提案する。注意機構を利用して、長距離コンテキストと機能間関係に選択的にフォーカスする。その結果、エンコーダネットワークの機能は、すでに非常に説明力があるが、ネットワークに注意を加えることで、パフォーマンスがさらに向上していることがわかった。
論文参考訳（メタデータ） (2021-06-17T16:34:37Z)
D3Feat: Joint Learning of Dense Detection and Description of 3D Local Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文参考訳（メタデータ） (2020-03-06T12:51:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。