論文の概要: Resolving Class Imbalance for LiDAR-based Object Detector by Dynamic
Weight Average and Contextual Ground Truth Sampling
- arxiv url: http://arxiv.org/abs/2210.03331v1
- Date: Fri, 7 Oct 2022 05:23:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 13:58:49.078248
- Title: Resolving Class Imbalance for LiDAR-based Object Detector by Dynamic
Weight Average and Contextual Ground Truth Sampling
- Title(参考訳): 動的重み平均と文脈的地味サンプリングによるLiDAR型物体検出器のクラス不均衡の解消
- Authors: Daeun Lee, Jongwon Park, Jinkyu Kim
- Abstract要約: 実世界の運転データセットは、しばしばデータ不均衡の問題に悩まされる。
このデータ不均衡問題に対処する手法を提案する。
KITTIおよびnuScenesデータセットを用いた実験により,提案手法の有効性が確認された。
- 参考スコア(独自算出の注目度): 7.096611243139798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An autonomous driving system requires a 3D object detector, which must
perceive all present road agents reliably to navigate an environment safely.
However, real-world driving datasets often suffer from the problem of data
imbalance, which causes difficulties in training a model that works well across
all classes, resulting in an undesired imbalanced sub-optimal performance. In
this work, we propose a method to address this data imbalance problem. Our
method consists of two main components: (i) a LiDAR-based 3D object detector
with per-class multiple detection heads where losses from each head are
modified by dynamic weight average to be balanced. (ii) Contextual ground truth
(GT) sampling, where we improve conventional GT sampling techniques by
leveraging semantic information to augment point cloud with sampled ground
truth GT objects. Our experiment with KITTI and nuScenes datasets confirms our
proposed method's effectiveness in dealing with the data imbalance problem,
producing better detection accuracy compared to existing approaches.
- Abstract(参考訳): 自律運転システムは3Dオブジェクト検出器を必要としており、環境を安全にナビゲートするためには、現在の道路エージェント全てを確実に認識する必要がある。
しかし、実世界の運転データセットはデータ不均衡の問題に悩まされることが多く、全てのクラスでうまく機能するモデルのトレーニングが困難になり、望ましくない不均衡な準最適性能をもたらす。
本研究では,このデータ不均衡問題に対処する手法を提案する。
本手法は2つの主成分から構成される。
(i)LiDARベースの3Dオブジェクト検出器で、各頭部からの損失を動的重量平均で修正し、バランスをとることができる。
(II) 文脈的基底真理(GT)サンプリングでは, 意味情報を活用し, 実地真理GTオブジェクトをサンプル化した点クラウドに拡張することで, 従来のGTサンプリング技術を改善する。
KITTI と nuScenes データセットを用いた実験により,提案手法がデータ不均衡問題に対処する上で有効であることを確認し,既存の手法と比較して検出精度が向上した。
関連論文リスト
- Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Real-Time Object Detection in Occluded Environment with Background
Cluttering Effects Using Deep Learning [0.8192907805418583]
混在した環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中する。
開発した手法は、カスタムデータセットを作成し、ノイズの多いデータセットをきれいにするために前処理技術を使用する。
SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。
論文 参考訳(メタデータ) (2024-01-02T01:30:03Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - DuEqNet: Dual-Equivariance Network in Outdoor 3D Object Detection for
Autonomous Driving [4.489333751818157]
まず3次元物体検出ネットワークに等分散の概念を導入するDuEqNetを提案する。
我々のモデルの双対同変は、局所的および大域的両方の同変的特徴を抽出することができる。
本モデルでは, 配向精度が向上し, 予測効率が向上する。
論文 参考訳(メタデータ) (2023-02-27T08:30:02Z) - Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object
Detection [58.81316192862618]
自律運転における3D知覚のための2つの重要なセンサーは、カメラとLiDARである。
これら2つのモダリティを融合させることで、3次元知覚モデルの性能を大幅に向上させることができる。
我々は、最先端の核融合法を初めてベンチマークした。
論文 参考訳(メタデータ) (2022-05-30T09:35:37Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Pattern-Aware Data Augmentation for LiDAR 3D Object Detection [7.394029879643516]
本稿では,LiDARの特性に基づいてオブジェクトの点群をダウンサンプリングするデータ拡張手法である,パターン認識基底真理サンプリングを提案する。
自動車クラスにおけるPV-RCNNの性能は,25m以上の距離で分割したKITTI検証で0.7%以上向上した。
論文 参考訳(メタデータ) (2021-11-30T19:14:47Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z) - Leveraging Uncertainties for Deep Multi-modal Object Detection in
Autonomous Driving [12.310862288230075]
この研究は、LiDAR点雲とRGBカメラ画像を組み合わせて、堅牢で正確な3Dオブジェクト検出を行う確率論的ディープニューラルネットワークを提案する。
分類および回帰作業における不確実性を明示的にモデル化し、不確実性を活用してサンプリング機構を用いて核融合ネットワークを訓練する。
論文 参考訳(メタデータ) (2020-02-01T14:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。