論文の概要: DI-V2X: Learning Domain-Invariant Representation for
Vehicle-Infrastructure Collaborative 3D Object Detection
- arxiv url: http://arxiv.org/abs/2312.15742v1
- Date: Mon, 25 Dec 2023 14:40:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 16:43:27.615395
- Title: DI-V2X: Learning Domain-Invariant Representation for
Vehicle-Infrastructure Collaborative 3D Object Detection
- Title(参考訳): DI-V2X:車両・インフラ協調3次元物体検出のための領域不変表現学習
- Authors: Li Xiang and Junbo Yin and Wei Li and Cheng-Zhong Xu and Ruigang Yang
and Jianbing Shen
- Abstract要約: DI-V2Xは、新しい蒸留フレームワークを通じてドメイン不変表現を学習することを目的としている。
DI-V2Xは、ドメイン混合インスタンス拡張(DMA)モジュール、プログレッシブドメイン不変蒸留(PDD)モジュール、ドメイン適応融合(DAF)モジュールの3つの必須成分から構成される。
- 参考スコア(独自算出の注目度): 78.09431523221458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vehicle-to-Everything (V2X) collaborative perception has recently gained
significant attention due to its capability to enhance scene understanding by
integrating information from various agents, e.g., vehicles, and
infrastructure. However, current works often treat the information from each
agent equally, ignoring the inherent domain gap caused by the utilization of
different LiDAR sensors of each agent, thus leading to suboptimal performance.
In this paper, we propose DI-V2X, that aims to learn Domain-Invariant
representations through a new distillation framework to mitigate the domain
discrepancy in the context of V2X 3D object detection. DI-V2X comprises three
essential components: a domain-mixing instance augmentation (DMA) module, a
progressive domain-invariant distillation (PDD) module, and a domain-adaptive
fusion (DAF) module. Specifically, DMA builds a domain-mixing 3D instance bank
for the teacher and student models during training, resulting in aligned data
representation. Next, PDD encourages the student models from different domains
to gradually learn a domain-invariant feature representation towards the
teacher, where the overlapping regions between agents are employed as guidance
to facilitate the distillation process. Furthermore, DAF closes the domain gap
between the students by incorporating calibration-aware domain-adaptive
attention. Extensive experiments on the challenging DAIR-V2X and V2XSet
benchmark datasets demonstrate DI-V2X achieves remarkable performance,
outperforming all the previous V2X models. Code is available at
https://github.com/Serenos/DI-V2X
- Abstract(参考訳): 車両間協調認識(V2X)は、近年、車両やインフラなどの様々なエージェントからの情報を統合することで、シーン理解を強化する能力によって注目されている。
しかし、現在の研究はしばしば各エージェントからの情報を等しく扱い、各エージェントの異なるLiDARセンサの利用による固有のドメインギャップを無視し、最適以下の性能をもたらす。
本稿では, v2x 3d オブジェクト検出の文脈における領域差を緩和するために, 新しい蒸留フレームワークを用いて, ドメイン不変表現を学習することを目的とした di-v2x を提案する。
DI-V2Xは、ドメイン混合インスタンス拡張(DMA)モジュール、プログレッシブドメイン不変蒸留(PDD)モジュール、ドメイン適応融合(DAF)モジュールの3つの必須成分から構成される。
具体的には、DMAは、トレーニング中に教師と学生モデルのためのドメインミキシングされた3Dインスタンスバンクを構築する。
次に、PDDは、異なるドメインの学生モデルに対して、徐々に教師に対するドメイン不変の特徴表現を学習するよう促し、そこでは、エージェント間の重複する領域を、蒸留プロセスを促進するためのガイダンスとして採用する。
さらに、DAFは校正対応ドメイン適応型注意を取り入れることで、学生間のドメインギャップを埋める。
挑戦的なDAIR-V2XとV2XSetベンチマークデータセットに関する大規模な実験では、DI-V2Xは、以前のV2Xモデルよりも優れたパフォーマンスを誇示している。
コードはhttps://github.com/Serenos/DI-V2Xで入手できる。
関連論文リスト
- LiOn-XA: Unsupervised Domain Adaptation via LiDAR-Only Cross-Modal Adversarial Training [61.26381389532653]
LiOn-XAは、LiDAR-Only Cross-Modal (X)学習と3D LiDARポイントクラウドセマンティックセマンティックセグメンテーションのためのAdversarial Trainingを組み合わせた、教師なしドメイン適応(UDA)アプローチである。
3つの現実的適応シナリオに関する実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-10-21T09:50:17Z) - Multimodal 3D Object Detection on Unseen Domains [37.142470149311904]
ドメイン適応アプローチは、この問題に対処するために、テストディストリビューションから無注釈のサンプルへのアクセスを前提とします。
マルチモーダル融合および3次元オブジェクト検出のための教師付きコントラスト学習フレームワークであるCLIX$text3D$を提案する。
CLIX$text3D$は、複数のデータセットシフト下での最先端のドメイン一般化性能を示す。
論文 参考訳(メタデータ) (2024-04-17T21:47:45Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - CL3D: Unsupervised Domain Adaptation for Cross-LiDAR 3D Detection [16.021932740447966]
クロスLiDAR3D検出のためのドメイン適応は、生データ表現に大きなギャップがあるため困難である。
以上の課題を克服する、教師なしのドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2022-12-01T03:22:55Z) - Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval [55.122020263319634]
ビデオモーメント検索(VMR)は、与えられた言語クエリに従って、未編集のビデオからターゲットモーメントをローカライズすることを目的としている。
本稿では、新しいタスクであるクロスドメインVMRに焦点を当て、完全なアノテーション付きデータセットをひとつのドメインで利用できるが、関心のあるドメインは、注釈なしのデータセットのみを含む。
本稿では、アノテーションの知識をソースドメインからターゲットドメインに転送するマルチモーダル・クロスドメインアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T12:58:20Z) - An Unsupervised Domain Adaptive Approach for Multimodal 2D Object
Detection in Adverse Weather Conditions [5.217255784808035]
本稿では、ソースとターゲットドメイン間のドメインギャップを埋めるために、教師なしのドメイン適応フレームワークを提案する。
天候の歪みをシミュレートするデータ拡張方式を用いて、ドメインの混乱を増し、ソースデータへの過度な適合を防止する。
DENSEデータセットで行った実験は、我々の手法がドメインギャップを大幅に軽減できることを示している。
論文 参考訳(メタデータ) (2022-03-07T18:10:40Z) - Student Become Decathlon Master in Retinal Vessel Segmentation via
Dual-teacher Multi-target Domain Adaptation [1.121358474059223]
本稿では,マルチモーダルおよびマルチセンタ網膜画像から網膜血管(RV)をセグメント化するための,新しい教師なしマルチターゲットドメイン適応手法であるRVmsを提案する。
RVms は RV のセグメンテーションの観点からは,ターゲットとする Oracle に非常に近いことが分かっています。
論文 参考訳(メタデータ) (2022-03-07T02:20:14Z) - Adaptive Hierarchical Dual Consistency for Semi-Supervised Left Atrium
Segmentation on Cross-Domain Data [8.645556125521246]
ドメイン間データに対する半教師付き学習の一般化は、モデルの堅牢性を改善するために重要である。
AHDCはBAI(Bidirectional Adversarial Inference Module)とHDC(Hierarchical Dual Consistency Learning Module)から構成されている。
今回提案したAHDCは, 異なる中心部からの3D遅延心筋MR(LGE-CMR)データセットと3DCTデータセットを用いて, 評価を行った。
論文 参考訳(メタデータ) (2021-09-17T02:15:10Z) - Domain2Vec: Domain Embedding for Unsupervised Domain Adaptation [56.94873619509414]
従来の教師なしドメイン適応は、限られた数のドメイン間の知識伝達を研究する。
本稿では,特徴不整合とグラム行列の連成学習に基づいて,視覚領域のベクトル表現を提供する新しいDomain2Vecモデルを提案する。
我々の埋め込みは、異なるドメイン間の視覚的関係に関する直感と一致するドメイン類似性を予測できることを示した。
論文 参考訳(メタデータ) (2020-07-17T22:05:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。