論文の概要: Domain generalization of 3D semantic segmentation in autonomous driving
- arxiv url: http://arxiv.org/abs/2212.04245v2
- Date: Mon, 20 Mar 2023 09:41:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 01:20:52.070912
- Title: Domain generalization of 3D semantic segmentation in autonomous driving
- Title(参考訳): 自律運転における3次元セマンティックセグメンテーションのドメイン一般化
- Authors: Jules Sanchez and Jean-Emmanuel Deschaud and Francois Goulette
- Abstract要約: 本稿では,3次元自律走行セマンティックセグメンテーションのための最初のベンチマークを示す。
本稿では,レーザーイメージング検出とラングング(LiDAR)ドメインシフトに対処することの難しさについて論じる。
本稿では3DLabelPropと呼ぶこの領域の一般化に対処するために設計された最初の手法を提案する。
- 参考スコア(独自算出の注目度): 3.8243923744440926
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using deep learning, 3D autonomous driving semantic segmentation has become a
well-studied subject, with methods that can reach very high performance.
Nonetheless, because of the limited size of the training datasets, these models
cannot see every type of object and scene found in real-world applications. The
ability to be reliable in these various unknown environments is called domain
generalization.
Despite its importance, domain generalization is relatively unexplored in the
case of 3D autonomous driving semantic segmentation. To fill this gap, this
paper presents the first benchmark for this application by testing
state-of-the-art methods and discussing the difficulty of tackling Laser
Imaging Detection and Ranging (LiDAR) domain shifts.
We also propose the first method designed to address this domain
generalization, which we call 3DLabelProp. This method relies on leveraging the
geometry and sequentiality of the LiDAR data to enhance its generalization
performances by working on partially accumulated point clouds. It reaches a
mean Intersection over Union (mIoU) of 50.4% on SemanticPOSS and of 55.2% on
PandaSet solid-state LiDAR while being trained only on SemanticKITTI, making it
the state-of-the-art method for generalization (+5% and +33% better,
respectively, than the second best method).
The code for this method will be available on GitHub.
- Abstract(参考訳): ディープラーニングを使うことで、3d自律運転セマンティクスセグメンテーションは十分に研究され、非常に高いパフォーマンスに到達できる手法となっている。
それでも、トレーニングデータセットのサイズが限られているため、これらのモデルは現実世界のアプリケーションに見られるあらゆる種類のオブジェクトやシーンを見ることはできない。
これらの未知の環境で信頼性を持つ能力は、ドメイン一般化と呼ばれる。
その重要性にもかかわらず、ドメインの一般化は3次元自律運転セマンティックセグメンテーションの場合、比較的未解明である。
このギャップを埋めるために,本稿では,最先端の手法を試行し,レーザーイメージング検出とラングング(LiDAR)ドメインシフトに取り組むことの難しさを論じる,この応用のための最初のベンチマークを提案する。
また,この領域の一般化に対処するために設計された最初の手法を提案し,これを3DLabelPropと呼ぶ。
この方法は、LiDARデータの幾何とシーケンシャル性を利用して、部分的に蓄積された点雲に取り組むことにより、その一般化性能を向上させる。
これはsemanticpossでは50.4%、semantickittiでは55.2%、semanticposspossでは50.4%、semantickittiでは55.2%という平均交点に達した。
このメソッドのコードはGitHubで入手できる。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - Augmented Efficiency: Reducing Memory Footprint and Accelerating Inference for 3D Semantic Segmentation through Hybrid Vision [9.96433151449016]
本稿では,2次元と3次元のコンピュータビジョン技術を組み合わせた3次元セマンティックセグメンテーションの新たなアプローチを提案する。
我々は3次元点雲にリンクしたRGB画像に対して2Dセマンティックセマンティックセマンティックセマンティクスを行い、その結果をクラスラベルの押出手法を用いて3Dに拡張する。
このモデルは、KITTI-360データセット上の最先端の3Dセマンティックセマンティックセグメンテーションモデルとして機能する。
論文 参考訳(メタデータ) (2024-07-23T00:04:10Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Explain What You See: Open-Ended Segmentation and Recognition of
Occluded 3D Objects [0.0]
局所HDPの柔軟性を有する3次元オブジェクト分割法を提案する。
提案手法は,より少ない数の学習インスタンスを用いて,連合間の平均交叉率が高いことを示す。
得られたモデルが3次元オブジェクトカテゴリ認識タスクに対して明確な説明セットを生成することを示す。
論文 参考訳(メタデータ) (2023-01-17T17:43:46Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - PerMO: Perceiving More at Once from a Single Image for Autonomous
Driving [76.35684439949094]
単一画像から完全テクスチャ化された車両の3次元モデルを検出し,セグメント化し,再構成する新しい手法を提案する。
私たちのアプローチは、ディープラーニングの強みと従来のテクニックの優雅さを組み合わせています。
我々はこれらのアルゴリズムを自律運転システムに統合した。
論文 参考訳(メタデータ) (2020-07-16T05:02:45Z) - 3D-MiniNet: Learning a 2D Representation from Point Clouds for Fast and
Efficient 3D LIDAR Semantic Segmentation [9.581605678437032]
3D-MiniNetは、3Dと2Dの学習層を組み合わせたLIDARセマンティックセグメンテーションの新しいアプローチである。
まず,3次元データから局所的およびグローバル的情報を抽出する新しいプロジェクションにより,原点から2次元表現を学習する。
これらの2Dセマンティックラベルは、3D空間に再プロジェクションされ、後処理モジュールを通じて拡張される。
論文 参考訳(メタデータ) (2020-02-25T14:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。