論文の概要: See Eye to Eye: A Lidar-Agnostic 3D Detection Framework for Unsupervised
Multi-Target Domain Adaptation
- arxiv url: http://arxiv.org/abs/2111.09450v1
- Date: Wed, 17 Nov 2021 23:46:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 14:20:23.760146
- Title: See Eye to Eye: A Lidar-Agnostic 3D Detection Framework for Unsupervised
Multi-Target Domain Adaptation
- Title(参考訳): see eye to eye: 教師なしマルチターゲットドメイン適応のためのライダー非依存3d検出フレームワーク
- Authors: Darren Tsai and Julie Stephany Berrio and Mao Shan and Stewart Worrall
and Eduardo Nebot
- Abstract要約: 本稿では,ライダー間における最先端3D検出器の性能伝達のための,教師なしマルチターゲットドメイン適応フレームワークであるSEEを提案する。
提案手法は,検出ネットワークに渡す前に,基礎となる形状を補間し,異なるライダーからの物体の走査パターンを正規化する。
我々は、SEEが公開データセット上で有効であること、最先端の成果を達成できること、そして、我々のフレームワークの産業的応用を証明するために、新しい高解像度ライダーに定量的な結果を提供することを実証する。
- 参考スコア(独自算出の注目度): 6.671002960645259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sampling discrepancies between different manufacturers and models of lidar
sensors result in inconsistent representations of objects. This leads to
performance degradation when 3D detectors trained for one lidar are tested on
other types of lidars. Remarkable progress in lidar manufacturing has brought
about advances in mechanical, solid-state, and recently, adjustable scan
pattern lidars. For the latter, existing works often require fine-tuning the
model each time scan patterns are adjusted, which is infeasible. We explicitly
deal with the sampling discrepancy by proposing a novel unsupervised
multi-target domain adaptation framework, SEE, for transferring the performance
of state-of-the-art 3D detectors across both fixed and flexible scan pattern
lidars without requiring fine-tuning of models by end-users. Our approach
interpolates the underlying geometry and normalizes the scan pattern of objects
from different lidars before passing them to the detection network. We
demonstrate the effectiveness of SEE on public datasets, achieving
state-of-the-art results, and additionally provide quantitative results on a
novel high-resolution lidar to prove the industry applications of our
framework. This dataset and our code will be made publicly available.
- Abstract(参考訳): 異なるメーカーとライダーセンサーのモデルとの相違をサンプリングすると、オブジェクトの不整合表現が生じる。
これにより、1つのライダーのために訓練された3D検出器が他のタイプのライダーでテストされると性能が低下する。
ライダー製造の著しい進歩は、機械的、固体的、そして近年では調整可能なスキャンパターンlidarの進歩をもたらした。
後者では、スキャンパターンが調整されるたびにモデルを微調整する必要があることが多い。
我々は,新しい非教師付きマルチターゲットドメイン適応フレームワークの提案により,ユーザによるモデルの微調整を必要とせず,固定およびフレキシブルなスキャンパターンlidarをまたいで最先端の3d検出器の性能を伝達することにより,サンプリングの不一致を明示的に処理する。
提案手法は,基盤となる形状を補間し,異なるライダーの物体の走査パターンを正規化し,検出ネットワークに渡す。
我々は、SEEが公開データセット上で有効であること、最先端の成果を達成できること、そして、我々のフレームワークの産業的応用を証明するために、新しい高解像度ライダーに定量的な結果を提供する。
このデータセットとコードは公開される予定だ。
関連論文リスト
- Diff3DETR:Agent-based Diffusion Model for Semi-supervised 3D Object Detection [33.58208166717537]
3次元物体検出は3次元シーンの理解に不可欠である。
半教師付き手法の最近の発展は、教師による学習フレームワークを用いて、未ラベルの点群に対する擬似ラベルを生成することにより、この問題を緩和しようとしている。
半教師付き3次元物体検出のためのエージェントベース拡散モデル(Diff3DETR)を提案する。
論文 参考訳(メタデータ) (2024-08-01T05:04:22Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - You Only Need Two Detectors to Achieve Multi-Modal 3D Multi-Object Tracking [9.20064374262956]
提案手法は,2次元検出器と3次元検出器のみを用いて,ロバストなトラッキングを実現する。
多くの最先端のTBDベースのマルチモーダルトラッキング手法よりも正確であることが証明されている。
論文 参考訳(メタデータ) (2023-04-18T02:45:18Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。
我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-03-21T17:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。