論文の概要: One for All: Multi-Domain Joint Training for Point Cloud Based 3D Object Detection
- arxiv url: http://arxiv.org/abs/2411.01584v1
- Date: Sun, 03 Nov 2024 14:21:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:39:50.763685
- Title: One for All: Multi-Domain Joint Training for Point Cloud Based 3D Object Detection
- Title(参考訳): ポイントクラウドを用いた3次元物体検出のためのマルチドメイン共同訓練
- Authors: Zhenyu Wang, Yali Li, Hengshuang Zhao, Shengjin Wang,
- Abstract要約: textbfOneDet3Dは、異なるドメイン間での3D検出に対処する汎用的なワン・ツー・オール・モデルである。
本稿では、データ干渉問題に対処するため、ルーティング機構によって誘導される散乱とコンテキストにおけるドメイン認識を提案する。
完全なスパース構造とアンカーフリーヘッドは、さらに大きなスケールの差のある点雲を収容する。
- 参考スコア(独自算出の注目度): 71.78795573911512
- License:
- Abstract: The current trend in computer vision is to utilize one universal model to address all various tasks. Achieving such a universal model inevitably requires incorporating multi-domain data for joint training to learn across multiple problem scenarios. In point cloud based 3D object detection, however, such multi-domain joint training is highly challenging, because large domain gaps among point clouds from different datasets lead to the severe domain-interference problem. In this paper, we propose \textbf{OneDet3D}, a universal one-for-all model that addresses 3D detection across different domains, including diverse indoor and outdoor scenes, within the \emph{same} framework and only \emph{one} set of parameters. We propose the domain-aware partitioning in scatter and context, guided by a routing mechanism, to address the data interference issue, and further incorporate the text modality for a language-guided classification to unify the multi-dataset label spaces and mitigate the category interference issue. The fully sparse structure and anchor-free head further accommodate point clouds with significant scale disparities. Extensive experiments demonstrate the strong universal ability of OneDet3D to utilize only one trained model for addressing almost all 3D object detection tasks.
- Abstract(参考訳): コンピュータビジョンの現在の傾向は、すべてのタスクに対処するために1つの普遍モデルを利用することである。
このような普遍的なモデルを達成するには、複数の問題シナリオから学習するために、共同トレーニングに複数のドメインデータを組み込むことが必然的に必要となる。
しかし、ポイントクラウドベースの3Dオブジェクト検出では、異なるデータセットのポイントクラウド間の大きなドメインギャップが深刻なドメイン干渉問題を引き起こすため、このようなマルチドメイン共同トレーニングは非常に難しい。
本稿では,多様な屋内シーンや屋外シーンを含む,さまざまな領域における3次元検出に対処する汎用的な一対一モデルである \textbf{OneDet3D} を,パラメータの集合である \emph{same} フレームワーク内で提案する。
本稿では,データ干渉問題に対処するためのルーティング機構によって導かれる分散とコンテキストにおけるドメイン認識分割を提案し,さらに,複数データセットラベル空間を統一し,カテゴリ干渉問題を緩和するために,言語誘導型分類のためのテキストモダリティを取り入れた。
完全なスパース構造とアンカーフリーヘッドは、さらに大きなスケールの差のある点雲を収容する。
大規模な実験は、OneDet3Dがほぼ全ての3Dオブジェクト検出タスクに対処するために訓練された1つのモデルしか利用できないという強い普遍性を実証している。
関連論文リスト
- Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection [64.08296187555095]
Uni$2$Detは3D検出のための統一的で普遍的なマルチデータセットトレーニングのためのフレームワークである。
マルチデータセット3D検出のためのマルチステージプロンプトモジュールを提案する。
ゼロショットクロスデータセット転送の結果は,提案手法の一般化能力を検証する。
論文 参考訳(メタデータ) (2024-09-30T17:57:50Z) - PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.00221501105788]
ドメイン一般化(DG)は、最近、ポイントクラウド分類(PCC)モデルの、目に見えない領域への一般化性を改善するために研究されている。
本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。
本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文 参考訳(メタデータ) (2024-08-24T12:53:48Z) - Revisiting Cross-Domain Problem for LiDAR-based 3D Object Detection [5.149095033945412]
我々は最先端モデルのクロスドメイン性能を深く分析する。
ほとんどのモデルはトレーニングドメインに過度に適合し、それを他のドメインに直接適用することは困難である。
我々は、メソッドの精度レベルにおける過度な低下の中核的な問題を分析するために、サイドビューとフロントビューAPという、さらなる評価指標を提案する。
論文 参考訳(メタデータ) (2024-08-22T19:52:44Z) - Multimodal 3D Object Detection on Unseen Domains [37.142470149311904]
ドメイン適応アプローチは、この問題に対処するために、テストディストリビューションから無注釈のサンプルへのアクセスを前提とします。
マルチモーダル融合および3次元オブジェクト検出のための教師付きコントラスト学習フレームワークであるCLIX$text3D$を提案する。
CLIX$text3D$は、複数のデータセットシフト下での最先端のドメイン一般化性能を示す。
論文 参考訳(メタデータ) (2024-04-17T21:47:45Z) - Learning to Adapt SAM for Segmenting Cross-domain Point Clouds [25.66755977728181]
3Dセグメンテーションタスクにおける教師なしドメイン適応(UDA)は、非常に難しい課題である。
本稿では,3次元特徴空間とSAMの特徴空間との整合性を大幅に向上させる,革新的なハイブリッド機能拡張手法を提案する。
提案手法は,広く認識されている多くのデータセットで評価され,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-13T02:28:40Z) - SUG: Single-dataset Unified Generalization for 3D Point Cloud
Classification [44.27324696068285]
トレーニング済みのソースモデルが直面する予期せぬ領域差を軽減するために,単一データセット統一一般化(SUG)フレームワークを提案する。
具体的には、まず、学習した表現をドメインに依存しない識別性に制約できるマルチグラニュアルサブドメインアライメント(MSA)法を設計する。
次にSDA(Sample-level Domain-Aware Attention)戦略を示し、異なるサブドメインから簡単に適応できるサンプルを選択的に強化する。
論文 参考訳(メタデータ) (2023-05-16T04:36:04Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。