論文の概要: Resolving Class Imbalance for LiDAR-based Object Detector by Dynamic
Weight Average and Contextual Ground Truth Sampling
- arxiv url: http://arxiv.org/abs/2210.03331v1
- Date: Fri, 7 Oct 2022 05:23:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 13:58:49.078248
- Title: Resolving Class Imbalance for LiDAR-based Object Detector by Dynamic
Weight Average and Contextual Ground Truth Sampling
- Title(参考訳): 動的重み平均と文脈的地味サンプリングによるLiDAR型物体検出器のクラス不均衡の解消
- Authors: Daeun Lee, Jongwon Park, Jinkyu Kim
- Abstract要約: 実世界の運転データセットは、しばしばデータ不均衡の問題に悩まされる。
このデータ不均衡問題に対処する手法を提案する。
KITTIおよびnuScenesデータセットを用いた実験により,提案手法の有効性が確認された。
- 参考スコア(独自算出の注目度): 7.096611243139798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An autonomous driving system requires a 3D object detector, which must
perceive all present road agents reliably to navigate an environment safely.
However, real-world driving datasets often suffer from the problem of data
imbalance, which causes difficulties in training a model that works well across
all classes, resulting in an undesired imbalanced sub-optimal performance. In
this work, we propose a method to address this data imbalance problem. Our
method consists of two main components: (i) a LiDAR-based 3D object detector
with per-class multiple detection heads where losses from each head are
modified by dynamic weight average to be balanced. (ii) Contextual ground truth
(GT) sampling, where we improve conventional GT sampling techniques by
leveraging semantic information to augment point cloud with sampled ground
truth GT objects. Our experiment with KITTI and nuScenes datasets confirms our
proposed method's effectiveness in dealing with the data imbalance problem,
producing better detection accuracy compared to existing approaches.
- Abstract(参考訳): 自律運転システムは3Dオブジェクト検出器を必要としており、環境を安全にナビゲートするためには、現在の道路エージェント全てを確実に認識する必要がある。
しかし、実世界の運転データセットはデータ不均衡の問題に悩まされることが多く、全てのクラスでうまく機能するモデルのトレーニングが困難になり、望ましくない不均衡な準最適性能をもたらす。
本研究では,このデータ不均衡問題に対処する手法を提案する。
本手法は2つの主成分から構成される。
(i)LiDARベースの3Dオブジェクト検出器で、各頭部からの損失を動的重量平均で修正し、バランスをとることができる。
(II) 文脈的基底真理(GT)サンプリングでは, 意味情報を活用し, 実地真理GTオブジェクトをサンプル化した点クラウドに拡張することで, 従来のGTサンプリング技術を改善する。
KITTI と nuScenes データセットを用いた実験により,提案手法がデータ不均衡問題に対処する上で有効であることを確認し,既存の手法と比較して検出精度が向上した。
関連論文リスト
- 3D Multi-Object Tracking with Semi-Supervised GRU-Kalman Filter [6.13623925528906]
3D Multi-Object Tracking (MOT)は、自律運転やロボットセンシングのようなインテリジェントなシステムに不可欠である。
本稿では,学習可能なカルマンフィルタを移動モジュールに導入するGRUベースのMOT法を提案する。
このアプローチは、データ駆動学習を通じてオブジェクトの動き特性を学習することができ、手動モデル設計やモデルエラーを回避することができる。
論文 参考訳(メタデータ) (2024-11-13T08:34:07Z) - TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文 参考訳(メタデータ) (2024-07-11T14:58:49Z) - Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.0991686509715]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。
本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。
提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:30:10Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Real-Time Object Detection in Occluded Environment with Background
Cluttering Effects Using Deep Learning [0.8192907805418583]
混在した環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中する。
開発した手法は、カスタムデータセットを作成し、ノイズの多いデータセットをきれいにするために前処理技術を使用する。
SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。
論文 参考訳(メタデータ) (2024-01-02T01:30:03Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - DuEqNet: Dual-Equivariance Network in Outdoor 3D Object Detection for
Autonomous Driving [4.489333751818157]
まず3次元物体検出ネットワークに等分散の概念を導入するDuEqNetを提案する。
我々のモデルの双対同変は、局所的および大域的両方の同変的特徴を抽出することができる。
本モデルでは, 配向精度が向上し, 予測効率が向上する。
論文 参考訳(メタデータ) (2023-02-27T08:30:02Z) - Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object
Detection [58.81316192862618]
自律運転における3D知覚のための2つの重要なセンサーは、カメラとLiDARである。
これら2つのモダリティを融合させることで、3次元知覚モデルの性能を大幅に向上させることができる。
我々は、最先端の核融合法を初めてベンチマークした。
論文 参考訳(メタデータ) (2022-05-30T09:35:37Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z) - Leveraging Uncertainties for Deep Multi-modal Object Detection in
Autonomous Driving [12.310862288230075]
この研究は、LiDAR点雲とRGBカメラ画像を組み合わせて、堅牢で正確な3Dオブジェクト検出を行う確率論的ディープニューラルネットワークを提案する。
分類および回帰作業における不確実性を明示的にモデル化し、不確実性を活用してサンプリング機構を用いて核融合ネットワークを訓練する。
論文 参考訳(メタデータ) (2020-02-01T14:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。