論文の概要: Towards Cross-Platform Generalization: Domain Adaptive 3D Detection with Augmentation and Pseudo-Labeling
- arxiv url: http://arxiv.org/abs/2601.08174v1
- Date: Tue, 13 Jan 2026 03:09:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.037987
- Title: Towards Cross-Platform Generalization: Domain Adaptive 3D Detection with Augmentation and Pseudo-Labeling
- Title(参考訳): クロスプラットフォームの一般化に向けて:拡張と擬似ラベルによるドメイン適応型3次元検出
- Authors: Xiyan Feng, Wenbo Zhang, Lu Zhang, Yunzhi Zhuge, Huchuan Lu, You He,
- Abstract要約: この技術レポートは、RoboSense2025 Challengeにおけるクロスプラットフォームの3Dオブジェクト検出タスクに対する受賞したソリューションを表している。
提案手法は,ポイントベースとボクセルベースの機能を効果的に統合した,効率的な3次元オブジェクト検出フレームワークであるPVRCNN++に基づいている。
我々は,データ拡張と擬似ラベルによる自己学習戦略により,ドメインギャップを狭めることで,クロスプラットフォームの一般化を改善する。
- 参考スコア(独自算出の注目度): 58.42010583822351
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This technical report represents the award-winning solution to the Cross-platform 3D Object Detection task in the RoboSense2025 Challenge. Our approach is built upon PVRCNN++, an efficient 3D object detection framework that effectively integrates point-based and voxel-based features. On top of this foundation, we improve cross-platform generalization by narrowing domain gaps through tailored data augmentation and a self-training strategy with pseudo-labels. These enhancements enabled our approach to secure the 3rd place in the challenge, achieving a 3D AP of 62.67% for the Car category on the phase-1 target domain, and 58.76% and 49.81% for Car and Pedestrian categories respectively on the phase-2 target domain.
- Abstract(参考訳): この技術レポートは、RoboSense2025 Challengeにおけるクロスプラットフォームの3Dオブジェクト検出タスクに対する受賞したソリューションを表している。
提案手法は,ポイントベースとボクセルベースの機能を効果的に統合した,効率的な3次元オブジェクト検出フレームワークであるPVRCNN++に基づいている。
この基盤の上に,データ拡張の調整と擬似ラベルによる自己学習戦略により,ドメインギャップを狭めることで,クロスプラットフォームの一般化を改善する。
これらの改良により、我々は、フェーズ1ターゲットドメインのカーカテゴリーで62.67%の3D AP、フェーズ2ターゲットドメインでそれぞれ58.76%と49.81%のカーカテゴリーで3D APを達成した。
関連論文リスト
- TransBridge: Boost 3D Object Detection by Scene-Level Completion with Transformer Decoder [66.22997415145467]
本稿では,スパース領域における検出機能を改善する共同補完・検出フレームワークを提案する。
具体的には,トランスブリッジ(TransBridge)を提案する。トランスブリッジ(TransBridge)はトランスフォーマーをベースとした新しいアップサンプリングブロックである。
その結果,本フレームワークは,各手法の平均精度(mAP)が0.7から1.5の範囲で,エンドツーエンドの3Dオブジェクト検出を一貫して改善していることがわかった。
論文 参考訳(メタデータ) (2025-12-12T00:08:03Z) - Perspective-Invariant 3D Object Detection [6.7936328711743]
複数のプラットフォームから収集されたLiDARデータと3Dバウンディングボックスアノテーションを備えた最初のベンチマークであるPi3DETを紹介する。
我々は、よく研究された車両プラットフォームから他のプラットフォームに知識を伝達する新しいクロスプラットフォーム適応フレームワークを提案する。
クロスプラットフォームシナリオにおける現在の3D検出器のレジリエンスと堅牢性を評価するためのベンチマークを確立する。
論文 参考訳(メタデータ) (2025-07-23T16:29:57Z) - Detect, Augment, Compose, and Adapt: Four Steps for Unsupervised Domain
Adaptation in Object Detection [7.064953237013352]
教師なし領域適応(Unsupervised domain adapt、UDA)は、アノテートされたデータなしで、ソース学習された検出器を対象領域に適応させる際に、オブジェクト検出において重要な役割を果たす。
自己超越性を活用し,ソースとターゲットデータを同時に訓練する,新しい,効果的な4段階のUDA手法を提案する。
提案手法は最先端性能を実現し,平均精度(mAP)を2%以上向上させる。
論文 参考訳(メタデータ) (2023-08-29T14:48:29Z) - Bi3D: Bi-domain Active Learning for Cross-domain 3D Object Detection [32.29833072399945]
クロスドメインな3Dオブジェクト検出タスクを解決するために,Biドメインのアクティブな学習手法,すなわちBi3Dを提案する。
Bi3D は UDA ベースの作業 (84.29%) と比較して有望な目標領域検出精度 (KITTI の89.63%) を達成する。
論文 参考訳(メタデータ) (2023-03-10T12:38:37Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Cross-Domain Object Detection with Mean-Teacher Transformer [43.486392965014105]
平均教師知識伝達(MTKT)に基づくエンドツーエンドのクロスドメイン検出変換器を提案する。
本稿では,ドメインクエリベースの特徴アライメント (DQFA) やバイレベルグラフベースのプロトタイプアライメント (BGPA) ,トークンワイド画像特徴アライメント (TIFA) など,トランスフォーマーのアーキテクチャに基づく3つのレベルの特徴アライメント戦略を設計する。
特にSim10kからCityscapesのシナリオは52.6mAPから57.9mAPに大幅に改善されている。
論文 参考訳(メタデータ) (2022-05-03T17:11:55Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Point Transformer [122.2917213154675]
セルフアテンションネットワークを3Dポイントクラウド処理に適用することを検討する。
ポイントクラウドのセルフアテンションレイヤを設計し、セマンティックシーンセグメンテーションなどのタスクのためのセルフアテンションネットワークの構築に使用します。
ポイントトランスフォーマーの設計は、ドメインやタスク間の事前作業を改善する。
論文 参考訳(メタデータ) (2020-12-16T18:58:56Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z) - 1st Place Solution for Waymo Open Dataset Challenge -- 3D Detection and
Domain Adaptation [7.807118356899879]
本研究では,一段式,アンカーフリー,NMSフリーの3Dポイント・クラウド・オブジェクト検出器AFDetを提案する。
AFDetは私たちの勝利ソリューションの強力なベースラインとして機能します。
我々は、より強力なネットワークを設計し、デンシフィケーションとポイントペインティングを用いてポイントクラウドデータを強化する。
論文 参考訳(メタデータ) (2020-06-28T04:49:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。