論文の概要: StereoDistill: Pick the Cream from LiDAR for Distilling Stereo-based 3D
Object Detection
- arxiv url: http://arxiv.org/abs/2301.01615v1
- Date: Wed, 4 Jan 2023 13:38:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 15:39:57.939205
- Title: StereoDistill: Pick the Cream from LiDAR for Distilling Stereo-based 3D
Object Detection
- Title(参考訳): stereodistill: ステレオベースの3dオブジェクト検出用lidarからクリームを抽出
- Authors: Zhe Liu, Xiaoqing Ye, Xiao Tan, Errui Ding, Xiang Bai
- Abstract要約: ステレオ法とLiDAR法とのギャップを狭めるため,StereoDistillというクロスモーダル蒸留法を提案する。
StereoDistillの主な設計は、回帰のためのX-component Guided Distillation(XGD)と分類のためのCLD(Cross-anchor Logit Distillation)である。
- 参考スコア(独自算出の注目度): 93.10989714186788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a cross-modal distillation method named
StereoDistill to narrow the gap between the stereo and LiDAR-based approaches
via distilling the stereo detectors from the superior LiDAR model at the
response level, which is usually overlooked in 3D object detection
distillation. The key designs of StereoDistill are: the X-component Guided
Distillation~(XGD) for regression and the Cross-anchor Logit Distillation~(CLD)
for classification. In XGD, instead of empirically adopting a threshold to
select the high-quality teacher predictions as soft targets, we decompose the
predicted 3D box into sub-components and retain the corresponding part for
distillation if the teacher component pilot is consistent with ground truth to
largely boost the number of positive predictions and alleviate the mimicking
difficulty of the student model. For CLD, we aggregate the probability
distribution of all anchors at the same position to encourage the highest
probability anchor rather than individually distill the distribution at the
anchor level. Finally, our StereoDistill achieves state-of-the-art results for
stereo-based 3D detection on the KITTI test benchmark and extensive experiments
on KITTI and Argoverse Dataset validate the effectiveness.
- Abstract(参考訳): 本稿では,StereoDistillというクロスモーダル蒸留法を提案し,3次元物体検出蒸留で通常見過ごされる優れたLiDARモデルからステレオ検出器を蒸留することで,ステレオとLiDARをベースとしたアプローチのギャップを狭める。
ステレオ蒸留の主な設計は、回帰のためのX成分誘導蒸留(XGD)と分類のためのクロスアンカー論理蒸留(CLD)である。
XGDでは、高品質な教師予測をソフトターゲットとして選択するためのしきい値を経験的に採用するのではなく、予測された3Dボックスをサブコンポーネントに分解し、教師コンポーネントパイロットが地上の真実と整合性を保ち、肯定的な予測の数を大幅に増加させ、学生モデルの模倣困難を緩和する。
CLDの場合、各アンカーの確率分布を同じ位置に集約し、アンカーレベルでの分布を個別に蒸留するのではなく、最も高い確率アンカーを奨励する。
最後に,我々のStereoDistillは,KITTIテストベンチマークにおけるステレオベース3D検出の最先端結果と,KITTIとArgoverse Datasetの広範な実験により,その妥当性が検証された。
関連論文リスト
- Understanding Self-Distillation and Partial Label Learning in
Multi-Class Classification with Label Noise [12.636657455986144]
自己蒸留(英: Self-distillation, SD)とは、教師モデルの出力を用いて学生モデルを訓練する過程である。
本研究は,クロスエントロピー損失を伴う多クラス分類におけるSDを理論的に検討する。
論文 参考訳(メタデータ) (2024-02-16T07:13:12Z) - Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection [77.23918785277404]
半教師付き3次元物体検出のための拡散モデルを用いて,擬似ラベルの品質向上に向けた新たな視点であるDiffusion-SS3Dを提案する。
具体的には、劣化した3Dオブジェクトサイズとクラスラベル、分布を生成し、拡散モデルをデノナイズプロセスとして利用し、バウンディングボックス出力を得る。
我々は,ScanNetとSUN RGB-Dベンチマークデータセットの実験を行い,既存手法に対する最先端性能の実現を実証した。
論文 参考訳(メタデータ) (2023-12-05T18:54:03Z) - Adversarial Score Distillation: When score distillation meets GAN [3.5825440071527375]
既存のスコア蒸留をWGAN(Wasserstein Generative Adversarial Network)パラダイムで解読する。
WGANのパラダイムでは、既存のスコア蒸留は固定された準最適判別器を使うか、不完全判別器の最適化を行うかのいずれかである。
本稿では、最適な判別器を維持し、完全な最適化目標を用いて更新するASD(Adversarial Score Distillation)を提案する。
論文 参考訳(メタデータ) (2023-12-01T17:20:47Z) - MonoSKD: General Distillation Framework for Monocular 3D Object
Detection via Spearman Correlation Coefficient [11.48914285491747]
既存のモノクロ3D検出知識蒸留法は、通常、LiDARをイメージプレーンに投射し、それに従って教師ネットワークを訓練する。
本研究では,スピアマン相関係数に基づくモノクル3次元検出のための新しい知識蒸留フレームワークMonoSKDを提案する。
提案フレームワークは,推論計算コストを加算せずに提案するまでの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-17T14:48:02Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。
このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。
nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-30T01:44:30Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。