論文の概要: Deep Learning on 3D Semantic Segmentation: A Detailed Review
- arxiv url: http://arxiv.org/abs/2411.02104v1
- Date: Mon, 04 Nov 2024 14:15:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:39:30.429140
- Title: Deep Learning on 3D Semantic Segmentation: A Detailed Review
- Title(参考訳): 3Dセマンティックセグメンテーションの深層学習
- Authors: Thodoris Betsas, Andreas Georgopoulos, Anastasios Doulamis, Pierre Grussenmeyer,
- Abstract要約: 3Dセマンティック(3DSS)における最近の深層学習手法の総括的レビューと包括的分析を行った。
既存の9つのレビュー論文の分類体系に基づいて,3DSS深層学習手法の新しい分類体系を提案する。
利用可能な3DSSデータセットの概要は、リンクとともに提供されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this paper an exhaustive review and comprehensive analysis of recent and former deep learning methods in 3D Semantic Segmentation (3DSS) is presented. In the related literature, the taxonomy scheme used for the classification of the 3DSS deep learning methods is ambiguous. Based on the taxonomy schemes of 9 existing review papers, a new taxonomy scheme of the 3DSS deep learning methods is proposed, aiming to standardize it and improve the comparability and clarity across related studies. Furthermore, an extensive overview of the available 3DSS indoor and outdoor datasets is provided along with their links. The core part of the review is the detailed presentation of recent and former 3DSS deep learning methods and their classification using the proposed taxonomy scheme along with their GitHub repositories. Additionally, a brief but informative analysis of the evaluation metrics and loss functions used in 3DSS is included. Finally, a fruitful discussion of the examined 3DSS methods and datasets, is presented to foster new research directions and applications in the field of 3DSS. Supplementary, to this review a GitHub repository is provided (https://github.com/thobet/Deep-Learning-on-3D-Semantic-Segmentation-a- Detailed-Review) including a quick classification of over 400 3DSS methods, using the proposed taxonomy scheme.
- Abstract(参考訳): 本稿では,最近の3次元セマンティックセグメンテーション(3DSS)における深層学習手法の総括的レビューと包括的分析について述べる。
関連文献では,3DSS深層学習手法の分類に使用される分類法は曖昧である。
既存の9つのレビュー論文の分類体系に基づいて,3DSS深層学習手法の新しい分類体系を提案し,その標準化と,関連する研究の可視性と明確性の向上をめざした。
さらに、利用可能な3DSSの屋内および屋外データセットとそれらのリンクについて概観する。
レビューの中核となるのは、最近および以前の3DSSディープラーニングメソッドの詳細なプレゼンテーションと、提案された分類体系とGitHubリポジトリを使用した分類である。
さらに、3DSSで使用される評価指標と損失関数を簡潔に、かつ情報的に分析する。
最後に、3DSSの手法とデータセットに関する実りある議論を行い、3DSSの分野における新しい研究の方向性と応用を育成する。
このレビューには、提案された分類スキームを使用して400以上の3DSSメソッドの迅速な分類を含むGitHubリポジトリ(https://github.com/thobet/deep-Learning-on-3D-Semantic-Segmentation-a-Detailed-Review)が提供されている。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - Mushroom Segmentation and 3D Pose Estimation from Point Clouds using Fully Convolutional Geometric Features and Implicit Pose Encoding [25.598155230329972]
我々は,キノコを分類する深層学習手法を開発し,深度センサで取得した点雲の形で3次元データに基づいてそれらのポーズを推定する。
我々はキノコシーンの合成データセットを作成し、各キノコのポーズのような3D情報を完全に認識する。
提案したネットワークは完全な畳み込みバックボーンを持ち、スパース3Dデータを解析し、インスタンスセグメンテーションとポーズ推定タスクの両方を暗黙的に定義するポーズ情報を予測する。
論文 参考訳(メタデータ) (2024-04-17T12:37:25Z) - A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing
Objects in 3D Scenes [80.20670062509723]
3Dシークエンスキャプションは、3Dシーンの詳細な説明を作成することを目的とした、視覚言語によるブリッジングタスクである。
2次元の視覚的キャプションと比較して、現実世界の表現が密接なため、大きな可能性と課題が提示される。
既存手法の人気と成功にもかかわらず、この分野の進歩を要約した総合的な調査は乏しい。
論文 参考訳(メタデータ) (2024-03-12T10:04:08Z) - SAI3D: Segment Any Instance in 3D Scenes [68.57002591841034]
新規なゼロショット3Dインスタンスセグメンテーション手法であるSAI3Dを紹介する。
我々の手法は3Dシーンを幾何学的プリミティブに分割し、段階的に3Dインスタンスセグメンテーションにマージする。
ScanNet、Matterport3D、さらに難しいScanNet++データセットに関する実証的な評価は、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2023-12-17T09:05:47Z) - DC3DCD: unsupervised learning for multiclass 3D point cloud change
detection [0.0]
本稿では,DC3DCD(Deep 3D Change Detection)と呼ばれる教師なしの手法を提案する。
本手法は,画像分類のためのDeepClusterアプローチに基づいて,複雑な生の3DPCを扱う。
論文 参考訳(メタデータ) (2023-05-09T13:13:53Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Understanding the Challenges When 3D Semantic Segmentation Faces Class
Imbalanced and OOD Data [4.503636381237414]
3Dセマンティックセグメンテーションは、安全な自動運転システムを構築する上で不可欠なプロセスである。
3Dセマンティックセグメンテーションのためのディープラーニングモデルは、しばしばクラス不均衡問題とアウト・オブ・ディストリビューションデータに悩まされる。
本研究では,クラス不均衡が3DSS性能にどのように影響するか,モデルがカテゴリ予測の正しさを検出できるかを検討する。
論文 参考訳(メタデータ) (2022-03-01T03:53:18Z) - Segmenting 3D Hybrid Scenes via Zero-Shot Learning [13.161136148641813]
この研究は、ゼロショット学習の枠組みの下で、3Dハイブリッドシーンのポイントクラウドセマンティックセマンティックセマンティクスの問題に取り組むことを目的としている。
本稿では、PFNetと呼ばれる、オブジェクトの様々なクラスに対するポイント特徴を、見えていないクラスと見えないクラスの両方のセマンティック特徴を利用して合成するネットワークを提案する。
提案したPFNet は点特徴を合成するために GAN アーキテクチャを用いており、新しい意味正規化器を適用することにより、目に見えるクラスと目に見えないクラスの特徴のセマンティックな関係が統合される。
本研究では,S3DISデータセットとScanNetデータセットを6つの異なるデータ分割で再編成し,アルゴリズム評価のための2つのベンチマークを提案する。
論文 参考訳(メタデータ) (2021-07-01T13:21:49Z) - Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions [70.0171362989609]
本稿では,FG3D-Netと呼ばれる新しい3次元形状分類手法を提案する。
詳細な3次元形状データセットに基づく結果から,本手法が他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-26T06:53:19Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。