論文の概要: MSCN: Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2501.16289v4
- Date: Sun, 24 Aug 2025 19:41:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 14:31:50.471457
- Title: MSCN: Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles
- Title(参考訳): MSCN: 自律走行車の領域不変点雲認識のための多視点構造畳み込みネットワーク
- Authors: Younggun Kim, Mohamed Abdel-Aty, Beomsik Cho, Seonghoon Ryoo, Soomok Lee,
- Abstract要約: マルチビュー構造畳み込みネットワーク(MSCN)はドメイン不変の認識を実現するために設計された新しいアーキテクチャである。
MSCNは、すべてのドメイン変更シナリオにおいて、最先端のクラウド分類方法よりも一貫して優れています。
- 参考スコア(独自算出の注目度): 1.7616042687330637
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Although LiDAR sensors have become indispensable for autonomous vehicles (AVs) due to their ability to provide accurate 3D scene understanding and robust perception under adverse weather conditions, the properties of LiDAR point clouds vary widely across sensor configurations and data acquisition domains, leading to severe performance degradation when models are transferred between heterogeneous sensors or from simulation to the real world. To address this challenge, we propose the Multi-view Structural Convolution Network (MSCN), a novel architecture designed to achieve domain-invariant recognition across diverse LiDAR configurations and environments. MSCN comprises Structural Convolution Layers (SCL) that extract local context geometric features from point clouds and Structural Aggregation Layers (SAL) that extract and aggregate both local and overall context features from point clouds. Furthermore, we incorporate an unseen domain generation strategy to mitigate domain gaps during training. Extensive experiments demonstrate that MSCN consistently outperforms state-of-the-art point cloud classification methods across all domain change scenarios. These results highlight MSCN as a scalable solution for deploying LiDAR-based perception systems of AVs. Our code is available at https://github.com/MLMLab/MSCN.
- Abstract(参考訳): LiDARセンサは、悪天候下での正確な3Dシーン理解と堅牢な認識を提供する能力により、自動運転車(AV)にとって欠かせないものとなっているが、LiDARポイント雲の特性はセンサーの構成やデータ取得領域によって大きく異なり、不均一なセンサー間でモデルが移動されたり、シミュレーションから実世界へ移動されたりすると、性能が著しく低下する。
この課題に対処するために,多視点構造畳み込みネットワーク (MSCN) を提案する。
MSCNは、ポイントクラウドから局所的コンテキスト幾何学的特徴を抽出する構造畳み込み層(SCL)と、ポイントクラウドから局所的および全体的コンテキスト特徴を抽出し集約する構造集積層(SAL)から構成される。
さらに、トレーニング中のドメインギャップを軽減するために、目に見えないドメイン生成戦略を組み込んだ。
大規模な実験により、MSCNはすべてのドメイン変更シナリオにおいて、最先端のクラウド分類方法より一貫して優れていることが示された。
これらの結果は、LiDARベースのAVの認識システムを展開するためのスケーラブルなソリューションとしてMSCNを強調している。
私たちのコードはhttps://github.com/MLMLab/MSCN.comで公開されています。
関連論文リスト
- Boosting Domain Incremental Learning: Selecting the Optimal Parameters is All You Need [25.45880299215022]
ドメインインクリメンタルラーニング(DIL)は、連続的なモデル適応を可能にするソリューションを提供する。
既存のPIDILメソッドは、ドメインの数と対応するクラスが増加するにつれてパラメータ選択の精度に悩まされる。
PIDILにおけるドメイン選択を改善する軽量フレームワークSOYOを提案する。
論文 参考訳(メタデータ) (2025-05-29T17:58:57Z) - High-Quality Pseudo-Label Generation Based on Visual Prompt Assisted Cloud Model Update [6.11503045313947]
既存の方法は、しばしば信頼性の高いクラウドモデルを仮定し、潜在的なエラーを無視したり、複雑な分散シフトに苦労する。
本稿では,クラウド適応型高品質擬似ラベル生成(CA-HQP)を提案する。
Bellevueトラフィックデータセットの実験により、CA-HQPは既存の手法と比較して、擬似ラベルの品質を著しく改善することが示された。
論文 参考訳(メタデータ) (2025-04-01T08:20:16Z) - PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.00221501105788]
領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。
本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。
本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文 参考訳(メタデータ) (2024-08-24T12:53:48Z) - 3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition [3.3748750222488657]
3D Adaptive Structure Convolution Network (3D-ASCN)は、3Dポイントクラウド認識のための最先端フレームワークである。
3次元畳み込みカーネル、構造木構造、および効果的な幾何学的特徴抽出のための適応近傍サンプリングを組み合わせる。
論文 参考訳(メタデータ) (2024-07-05T19:38:10Z) - Point Cloud Compression with Implicit Neural Representations: A Unified Framework [54.119415852585306]
我々は幾何学と属性の両方を扱える先駆的なクラウド圧縮フレームワークを提案する。
本フレームワークでは,2つの座標ベースニューラルネットワークを用いて,voxelized point cloudを暗黙的に表現する。
本手法は,既存の学習手法と比較して,高い普遍性を示す。
論文 参考訳(メタデータ) (2024-05-19T09:19:40Z) - InvariantOODG: Learning Invariant Features of Point Clouds for
Out-of-Distribution Generalization [17.96808017359983]
本稿では,異なる分布を持つ点雲間の不変性を学習するInvariantOODGを提案する。
学習可能なアンカーポイントの集合を定義し、最も有用な局所領域と入力点の雲を増大させる2種類の変換を定義する。
実験により,提案モデルが3次元領域一般化ベンチマークに与える影響を実証した。
論文 参考訳(メタデータ) (2024-01-08T09:41:22Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Collect-and-Distribute Transformer for 3D Point Cloud Analysis [82.03517861433849]
本稿では,点雲の短距離・長距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。
その結果,提案したCDFormerの有効性が示され,ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスがいくつか提供された。
論文 参考訳(メタデータ) (2023-06-02T03:48:45Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - ePointDA: An End-to-End Simulation-to-Real Domain Adaptation Framework
for LiDAR Point Cloud Segmentation [111.56730703473411]
LiDARデータ上でディープニューラルネットワーク(DNN)をトレーニングするには、大規模なポイントワイドアノテーションが必要である。
シミュレーション・トゥ・リアル・ドメイン適応(SRDA)は、DNNを無制限の合成データと自動生成されたラベルで訓練する。
ePointDAは、自己教師付きドロップアウトノイズレンダリング、統計不変および空間適応型特徴アライメント、転送可能なセグメンテーション学習の3つのモジュールで構成されている。
論文 参考訳(メタデータ) (2020-09-07T23:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。