論文の概要: A Novel Neural Network Training Method for Autonomous Driving Using
Semi-Pseudo-Labels and 3D Data Augmentations
- arxiv url: http://arxiv.org/abs/2207.09869v1
- Date: Wed, 20 Jul 2022 13:04:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 12:57:17.817097
- Title: A Novel Neural Network Training Method for Autonomous Driving Using
Semi-Pseudo-Labels and 3D Data Augmentations
- Title(参考訳): 半擬似ラベルと3次元データ拡張を用いた自律走行のための新しいニューラルネットワーク学習法
- Authors: Tamas Matuszka, Daniel Kozma
- Abstract要約: 自律運転のために3Dオブジェクト検出を行うためにニューラルネットワークを訓練するには、多種多様な注釈付きデータが必要である。
我々は3次元物体検出のための畳み込みニューラルネットワークを設計した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Training neural networks to perform 3D object detection for autonomous
driving requires a large amount of diverse annotated data. However, obtaining
training data with sufficient quality and quantity is expensive and sometimes
impossible due to human and sensor constraints. Therefore, a novel solution is
needed for extending current training methods to overcome this limitation and
enable accurate 3D object detection. Our solution for the above-mentioned
problem combines semi-pseudo-labeling and novel 3D augmentations. For
demonstrating the applicability of the proposed method, we have designed a
convolutional neural network for 3D object detection which can significantly
increase the detection range in comparison with the training data distribution.
- Abstract(参考訳): 自律運転のための3dオブジェクト検出を行うためにニューラルネットワークをトレーニングするには、多種多様な注釈データが必要である。
しかし、十分な品質と量でトレーニングデータを取得することは高価であり、人やセンサーの制約のため、時には不可能である。
したがって、この制限を克服し、正確な3dオブジェクト検出を可能にするために、現在のトレーニング方法を拡張するための新しいソリューションが必要である。
上記の問題の解法は, 半擬似ラベル法と新しい3次元拡張法を組み合わせたものである。
提案手法の適用性を示すため,3次元物体検出のための畳み込みニューラルネットワークの設計を行った。
関連論文リスト
- Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Simplified Learning of CAD Features Leveraging a Deep Residual
Autoencoder [3.567248644184455]
コンピュータビジョンでは、EfficientNetのような深い残留ニューラルネットワークが、堅牢性と精度の点で新しい標準を設定している。
ディープニューラルネットワークのトレーニングの根底にある重要な問題は、十分な量のトレーニングデータがないことだ。
本稿では,3次元CADモデル評価に関連する学習タスクの伝達を目的としたEfficientNetアーキテクチャに基づく残差3次元オートエンコーダを提案する。
論文 参考訳(メタデータ) (2022-02-21T10:27:55Z) - Semi-supervised 3D Object Detection via Temporal Graph Neural Networks [17.90796183565084]
3Dオブジェクト検出は、自動運転やその他のロボット工学応用において重要な役割を果たす。
本研究では,3次元物体検出器の半教師付き学習により,大量の未ラベルのクラウドビデオを活用することを提案する。
本手法は,難解な nuScenes と H3D ベンチマーク上での最先端検出性能を実現する。
論文 参考訳(メタデータ) (2022-02-01T02:06:54Z) - Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training [45.90045513731704]
本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。
4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
論文 参考訳(メタデータ) (2022-01-05T03:11:21Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Bridging the Reality Gap for Pose Estimation Networks using Sensor-Based
Domain Randomization [1.4290119665435117]
合成データに基づいて訓練された手法は、2Dの領域ランダム化をより発展させるため、2D画像を使用する。
提案手法では,3次元データをネットワークに統合し,ポーズ推定の精度を高める。
3つの大規模ポーズ推定ベンチマーク実験により, 提案手法は, 合成データを用いた従来手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2020-11-17T09:12:11Z) - Manual-Label Free 3D Detection via An Open-Source Simulator [50.74299948748722]
我々は、CARLAシミュレータを利用して、大量の自己ラベル付きトレーニングサンプルを生成する手動ラベルフリーな3D検出アルゴリズムを提案する。
ドメイン適応型VoxelNet(DA-VoxelNet)は、合成データから実際のシナリオへの分散ギャップを横断することができる。
実験の結果、提案されたDA 3D検出器は、KITTI評価セット上で76.66%と56.64%のmAPを達成することができた。
論文 参考訳(メタデータ) (2020-11-16T08:29:01Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Searching Learning Strategy with Reinforcement Learning for 3D Medical
Image Segmentation [15.059891142682117]
本稿では,強化学習を用いた最適学習戦略のための自動探索手法を提案する。
提案手法は,3次元医用画像分割の課題に対して有効である。
論文 参考訳(メタデータ) (2020-06-10T14:24:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。