論文の概要: Real-Time and Robust 3D Object Detection Within Road-Side LiDARs Using
Domain Adaptation
- arxiv url: http://arxiv.org/abs/2204.00132v2
- Date: Wed, 21 Jun 2023 16:27:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-23 18:21:04.152680
- Title: Real-Time and Robust 3D Object Detection Within Road-Side LiDARs Using
Domain Adaptation
- Title(参考訳): 領域適応を用いた道路側LiDAR内リアルタイム・ロバスト3次元物体検出
- Authors: Walter Zimmer, Marcus Grabler and Alois Knoll
- Abstract要約: 本研究は,インフラLiDARを用いた3次元オブジェクト検出の領域適応における課題を解決することを目的としている。
インフラベースLiDARの車両をリアルタイムで検出できるモデルDASE-ProPillarsを設計する。
- 参考スコア(独自算出の注目度): 2.658812114255374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work aims to address the challenges in domain adaptation of 3D object
detection using infrastructure LiDARs. We design a model DASE-ProPillars that
can detect vehicles in infrastructure-based LiDARs in real-time. Our model uses
PointPillars as the baseline model with additional modules to improve the 3D
detection performance. To prove the effectiveness of our proposed modules in
DASE-ProPillars, we train and evaluate the model on two datasets, the open
source A9-Dataset and a semi-synthetic infrastructure dataset created within
the Regensburg Next project. We do several sets of experiments for each module
in the DASE-ProPillars detector that show that our model outperforms the
SE-ProPillars baseline on the real A9 test set and a semi-synthetic A9 test
set, while maintaining an inference speed of 45 Hz (22 ms). We apply domain
adaptation from the semi-synthetic A9-Dataset to the semi-synthetic dataset
from the Regensburg Next project by applying transfer learning and achieve a 3D
mAP@0.25 of 93.49% on the Car class of the target test set using 40 recall
positions.
- Abstract(参考訳): 本研究は,インフラLiDARを用いた3次元オブジェクト検出の領域適応における課題を解決することを目的とする。
インフラベースLiDARの車両をリアルタイムで検出できるモデルDASE-ProPillarsを設計する。
我々のモデルは、3D検出性能を改善するために追加モジュールを備えたベースラインモデルとしてPointPillarsを使用します。
DASE-ProPillarsにおける提案するモジュールの有効性を証明するため,Regensburg Nextプロジェクトで開発されたオープンソースのA9-Datasetと半合成インフラストラクチャデータセットという,2つのデータセット上でモデルをトレーニングし,評価する。
dase-propillars検出器の各モジュールについて,本モデルが実a9テストセットと半合成a9テストセットのse-propillarsベースラインを上回り,45hz (22ms) の推論速度を維持していることを示す実験を行った。
半合成A9データセットから半合成データセットへのドメイン適応を、転送学習を適用して、40のリコール位置を用いた目標テストセットのCarクラスで93.49%の3D mAP@0.25を達成する。
関連論文リスト
- Transfer Learning from Simulated to Real Scenes for Monocular 3D Object Detection [9.708971995966476]
本稿では,これらの課題に対処するための2段階のトレーニング戦略を紹介する。
当社のアプローチでは,大規模合成データセットであるRoadSense3Dのモデルをトレーニングしています。
実世界のデータセットの組み合わせでモデルを微調整し、実用条件への適応性を高める。
論文 参考訳(メタデータ) (2024-08-28T08:44:58Z) - Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection [50.448520056844885]
室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
論文 参考訳(メタデータ) (2024-06-17T08:18:41Z) - MonoLSS: Learnable Sample Selection For Monocular 3D Detection [3.165441652093544]
Learnable Sample Selection (LSS)モジュールはGumbelSoftmaxと相対距離サンプル分割器をベースとしている。
MixUp3D法は、曖昧さを伴わない画像の原理に適合する3Dプロパティーサンプルを濃縮するために用いられる。
KITTIの3Dオブジェクト検出ベンチマークにおいて,MonoLSSは3つのカテゴリ(カー,サイクリスト,ペデストリアン)で1位にランクインした。
論文 参考訳(メタデータ) (2023-12-22T06:53:49Z) - Zero-Shot Refinement of Buildings' Segmentation Models using SAM [6.110856077714895]
本稿では,既存モデルの一般化損失に対処するために基礎モデルを適用する新しいアプローチを提案する。
いくつかのモデルの中で、私たちはSegment Anything Model(SAM)に焦点を当てています。
SAMは認識機能を提供しないので、ローカライズされたオブジェクトの分類とタグ付けに失敗する。
この新しいアプローチはSAMを認識能力で強化する。
論文 参考訳(メタデータ) (2023-10-03T07:19:59Z) - A Billion-scale Foundation Model for Remote Sensing Images [5.065947993017157]
基礎モデルの事前学習における3つの重要な要因は、事前学習方法、事前学習データセットのサイズ、モデルパラメータの数である。
本稿では,下流タスクにおける基礎モデルの性能に及ぼすモデルパラメータ数の増加の影響について検討する。
我々の知る限りでは、これはリモートセンシング分野における最初の10億ドル規模の基礎モデルである。
論文 参考訳(メタデータ) (2023-04-11T13:33:45Z) - Real-Time And Robust 3D Object Detection with Roadside LiDARs [20.10416681832639]
道路沿いのLiDARにおける交通参加者をリアルタイムに検出できる3次元物体検出モデルを設計する。
我々のモデルは既存の3D検出器をベースラインとして使用し、精度を向上させる。
スマートシティのアプリケーションに使用できるLiDARベースの3D検出器に多大な貢献をしています。
論文 参考訳(メタデータ) (2022-07-11T21:33:42Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Manual-Label Free 3D Detection via An Open-Source Simulator [50.74299948748722]
我々は、CARLAシミュレータを利用して、大量の自己ラベル付きトレーニングサンプルを生成する手動ラベルフリーな3D検出アルゴリズムを提案する。
ドメイン適応型VoxelNet(DA-VoxelNet)は、合成データから実際のシナリオへの分散ギャップを横断することができる。
実験の結果、提案されたDA 3D検出器は、KITTI評価セット上で76.66%と56.64%のmAPを達成することができた。
論文 参考訳(メタデータ) (2020-11-16T08:29:01Z) - PerMO: Perceiving More at Once from a Single Image for Autonomous
Driving [76.35684439949094]
単一画像から完全テクスチャ化された車両の3次元モデルを検出し,セグメント化し,再構成する新しい手法を提案する。
私たちのアプローチは、ディープラーニングの強みと従来のテクニックの優雅さを組み合わせています。
我々はこれらのアルゴリズムを自律運転システムに統合した。
論文 参考訳(メタデータ) (2020-07-16T05:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。