論文の概要: Understanding the Challenges When 3D Semantic Segmentation Faces Class
Imbalanced and OOD Data
- arxiv url: http://arxiv.org/abs/2203.00214v1
- Date: Tue, 1 Mar 2022 03:53:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 13:55:57.471540
- Title: Understanding the Challenges When 3D Semantic Segmentation Faces Class
Imbalanced and OOD Data
- Title(参考訳): 3次元セマンティックセグメンテーションがクラス不均衡とOODデータに直面する課題を理解する
- Authors: Yancheng Pan, Fan Xie, Huijing Zhao
- Abstract要約: 3Dセマンティックセグメンテーションは、安全な自動運転システムを構築する上で不可欠なプロセスである。
3Dセマンティックセグメンテーションのためのディープラーニングモデルは、しばしばクラス不均衡問題とアウト・オブ・ディストリビューションデータに悩まされる。
本研究では,クラス不均衡が3DSS性能にどのように影響するか,モデルがカテゴリ予測の正しさを検出できるかを検討する。
- 参考スコア(独自算出の注目度): 4.503636381237414
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: 3D semantic segmentation (3DSS) is an essential process in the creation of a
safe autonomous driving system. However, deep learning models for 3D semantic
segmentation often suffer from the class imbalance problem and
out-of-distribution (OOD) data. In this study, we explore how the class
imbalance problem affects 3DSS performance and whether the model can detect the
category prediction correctness, or whether data is ID (in-distribution) or
OOD. For these purposes, we conduct two experiments using three representative
3DSS models and five trust scoring methods, and conduct both a confusion and
feature analysis of each class. Furthermore, a data augmentation method for the
3D LiDAR dataset is proposed to create a new dataset based on SemanticKITTI and
SemanticPOSS, called AugKITTI. We propose the wPre metric and TSD for a more
in-depth analysis of the results, and follow are proposals with an insightful
discussion. Based on the experimental results, we find that: (1) the classes
are not only imbalanced in their data size but also in the basic properties of
each semantic category. (2) The intraclass diversity and interclass ambiguity
make class learning difficult and greatly limit the models' performance,
creating the challenges of semantic and data gaps. (3) The trust scores are
unreliable for classes whose features are confused with other classes. For 3DSS
models, those misclassified ID classes and OODs may also be given high trust
scores, making the 3DSS predictions unreliable, and leading to the challenges
in judging 3DSS result trustworthiness. All of these outcomes point to several
research directions for improving the performance and reliability of the 3DSS
models used for real-world applications.
- Abstract(参考訳): 3Dセマンティックセグメンテーション(3DSS)は、安全な自動運転システムを構築する上で不可欠なプロセスである。
しかし、3Dセマンティックセグメンテーションのためのディープラーニングモデルは、しばしばクラス不均衡問題とアウト・オブ・ディストリビューション(OOD)データに悩まされる。
本研究では,クラス不均衡が3DSS性能にどのように影響するか,モデルがカテゴリ予測の正しさを検出できるか,あるいはデータをID(in-distriion)かOODかを検討する。
これらの目的のために、3つの代表的3DSSモデルと5つの信頼評価手法を用いて2つの実験を行い、各クラスの混乱と特徴分析を行う。
さらに,3次元LiDARデータセットのデータ拡張手法を提案し,セマンティックKITTIとセマンティックPOSSに基づく新しいデータセット(AugKITTI)を作成する。
我々は、結果のより深い分析のために、wpreメトリックとtsdを提案し、それに続く提案を洞察に富んだ議論で述べる。
実験結果から,(1)クラスはデータサイズだけでなく,各セマンティックカテゴリの基本的特性も不均衡であることがわかった。
2)クラス内多様性とクラス間あいまいさは,クラス学習を困難にし,モデルの性能を大幅に制限し,セマンティックとデータギャップの課題を生み出す。
(3) 特徴が他のクラスと混同されているクラスでは信頼スコアが信頼できない。
3DSSモデルでは、それらの非分類IDクラスとOODも高い信頼スコアを与え、3DSS予測を信頼できないものにし、3DSS結果の信頼性を判断する上での課題となる。
これらの結果は、現実世界のアプリケーションに使用される3DSSモデルの性能と信頼性を改善するためのいくつかの研究の方向性を示している。
関連論文リスト
- DyConfidMatch: Dynamic Thresholding and Re-sampling for 3D Semi-supervised Learning [4.259908158892314]
半教師付き学習(SSL)はラベル付きで豊富なラベル付きデータを活用するが、データ不均衡の課題に直面することが多い。
本研究では,3次元SSLにおける学習状況の指標としてのクラスレベルの信頼度について検討し,動的しきい値を用いた新しい手法を提案する。
また、適切に表現されたクラスに対するバイアスを緩和し、同値なクラス表現を確保するために再サンプリング戦略も導入されている。
論文 参考訳(メタデータ) (2024-11-13T05:09:28Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Class-Level Confidence Based 3D Semi-Supervised Learning [18.95161296147023]
ラベル付きデータのクラスレベルの信頼度は,3次元不均衡データセットの学習状況を表すことができることを示す。
本手法は,3次元SSL分類および検出タスクにおいて,最先端技術よりも優れる。
論文 参考訳(メタデータ) (2022-10-18T20:13:28Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Hyperspectral Classification Based on Lightweight 3-D-CNN With Transfer
Learning [67.40866334083941]
限定サンプルに基づくHSI分類のためのエンドツーエンドの3次元軽量畳み込みニューラルネットワーク(CNN)を提案する。
従来の3D-CNNモデルと比較して,提案した3D-LWNetはネットワーク構造が深く,パラメータが小さく,計算コストも低い。
本モデルでは,HSI分類の競合性能を,いくつかの最先端手法と比較した。
論文 参考訳(メタデータ) (2020-12-07T03:44:35Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。