論文の概要: Walking Your LiDOG: A Journey Through Multiple Domains for LiDAR
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2304.11705v1
- Date: Sun, 23 Apr 2023 17:43:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 16:55:48.066234
- Title: Walking Your LiDOG: A Journey Through Multiple Domains for LiDAR
Semantic Segmentation
- Title(参考訳): lidogの歩行:lidarセマンティクスセグメンテーションのための複数のドメインを旅する
- Authors: Cristiano Saltori and Aljo\v{s}a O\v{s}ep and Elisa Ricci and Laura
Leal-Taix\'e
- Abstract要約: We study domain generalization for LiDAR semantic segmentation (DG-LSS)。
その結果,メソッド間の大きなギャップが確認され,ドメイン間設定で評価された。
そこで本研究では,DG-LSSに特化して設計された最初の手法を提案する。
- 参考スコア(独自算出の注目度): 12.852630056640114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to deploy robots that can operate safely in diverse environments
is crucial for developing embodied intelligent agents. As a community, we have
made tremendous progress in within-domain LiDAR semantic segmentation. However,
do these methods generalize across domains? To answer this question, we design
the first experimental setup for studying domain generalization (DG) for LiDAR
semantic segmentation (DG-LSS). Our results confirm a significant gap between
methods, evaluated in a cross-domain setting: for example, a model trained on
the source dataset (SemanticKITTI) obtains $26.53$ mIoU on the target data,
compared to $48.49$ mIoU obtained by the model trained on the target domain
(nuScenes). To tackle this gap, we propose the first method specifically
designed for DG-LSS, which obtains $34.88$ mIoU on the target domain,
outperforming all baselines. Our method augments a sparse-convolutional
encoder-decoder 3D segmentation network with an additional, dense 2D
convolutional decoder that learns to classify a birds-eye view of the point
cloud. This simple auxiliary task encourages the 3D network to learn features
that are robust to sensor placement shifts and resolution, and are transferable
across domains. With this work, we aim to inspire the community to develop and
evaluate future models in such cross-domain conditions.
- Abstract(参考訳): 多様な環境で安全に動作可能なロボットを配備する能力は、組み込まれたインテリジェントエージェントの開発に不可欠である。
コミュニティとして、私たちはドメイン内のLiDARセマンティックセマンティックセグメンテーションに大きな進歩を遂げました。
しかし、これらの手法はドメイン間で一般化されるのか?
そこで本研究では,LiDARセマンティックセグメンテーション(DG-LSS)のためのドメイン一般化(DG)を初めて研究するための実験的なセットアップを設計する。
例えば、ソースデータセット(semantickitti)でトレーニングされたモデルは、ターゲットドメイン(nuscenes)でトレーニングされたモデルによって得られた48.49ドルのmiouに対して、ターゲットデータに対して26.53ドルのmiouを取得します。
このギャップに対処するために、dg-lss用に特別に設計された最初の方法を提案し、ターゲットドメインで34.88ドルのmiouを取得し、すべてのベースラインを上回った。
本手法は,3次元分割ネットワークを高密度で高密度な2次元畳み込みデコーダで拡張し,点雲の鳥眼ビューの分類を学習する。
この単純な補助タスクは、センサー配置シフトや解像度に堅牢で、ドメイン間で転送可能な機能を学ぶことを3Dネットワークに促す。
本研究は,このようなクロスドメインな環境下での将来のモデルの開発と評価をコミュニティに促すことを目的としている。
関連論文リスト
- CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - Domain Generalization of 3D Object Detection by Density-Resampling [14.510085711178217]
ポイントクラウドベースの3Dオブジェクト検出は、新しいドメインギャップを持つデータに遭遇する際のパフォーマンス劣化に悩まされる。
対象領域に対する3次元物体検出の一般化性を向上させるためのSDG法を提案する。
本研究では,新しいデータ拡張手法を導入し,その方法論に新しいマルチタスク学習戦略を貢献する。
論文 参考訳(メタデータ) (2023-11-17T20:01:29Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - BEV-DG: Cross-Modal Learning under Bird's-Eye View for Domain
Generalization of 3D Semantic Segmentation [59.99683295806698]
クロスモーダルなUnsupervised Domain Adaptation (UDA)は、新しいドメインにおけるアノテーションの欠如を克服するために、2D-3Dデータの相補性を活用することを目的としている。
本稿では,BEV-DGと呼ばれる3次元セマンティックセグメンテーションの領域一般化(DG)に対する鳥眼図に基づくクロスモーダル学習を提案する。
論文 参考訳(メタデータ) (2023-08-12T11:09:17Z) - Bi3D: Bi-domain Active Learning for Cross-domain 3D Object Detection [32.29833072399945]
クロスドメインな3Dオブジェクト検出タスクを解決するために,Biドメインのアクティブな学習手法,すなわちBi3Dを提案する。
Bi3D は UDA ベースの作業 (84.29%) と比較して有望な目標領域検出精度 (KITTI の89.63%) を達成する。
論文 参考訳(メタデータ) (2023-03-10T12:38:37Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Geometry-Aware Network for Domain Adaptive Semantic Segmentation [64.00345743710653]
本稿では,ドメイン間のギャップを小さくするために,ドメイン適応のための幾何学的ネットワーク(GANDA)を提案する。
我々は、RGB-D画像から生成された点雲上の3Dトポロジを利用して、対象領域における座標色歪みと擬似ラベルの微細化を行う。
我々のモデルは,GTA5->CityscapesとSynTHIA->Cityscapesの最先端技術より優れている。
論文 参考訳(メタデータ) (2022-12-02T00:48:44Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。