論文の概要: Deep Learning Based 3D Segmentation: A Survey
- arxiv url: http://arxiv.org/abs/2103.05423v3
- Date: Wed, 26 Jul 2023 08:14:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 16:51:30.806119
- Title: Deep Learning Based 3D Segmentation: A Survey
- Title(参考訳): ディープラーニングに基づく3次元セグメンテーション:調査
- Authors: Yong He, Hongshan Yu, Xiaoyan Liu, Zhengeng Yang, Wei Sun, Ajmal Mian
- Abstract要約: 3Dセグメンテーションは、自律運転、ロボティクス、拡張現実、医療画像解析などの応用において、コンピュータビジョンの基本的な問題である。
近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。
本稿では,このギャップを埋め,ディープラーニングに基づく3Dセグメンテーションにおける最近の進歩を包括的に調査する。
- 参考スコア(独自算出の注目度): 29.402585297221457
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D segmentation is a fundamental and challenging problem in computer vision
with applications in autonomous driving, robotics, augmented reality and
medical image analysis. It has received significant attention from the computer
vision, graphics and machine learning communities. Conventional methods for 3D
segmentation, based on hand-crafted features and machine learning classifiers,
lack generalization ability. Driven by their success in 2D computer vision,
deep learning techniques have recently become the tool of choice for 3D
segmentation tasks. This has led to an influx of a large number of methods in
the literature that have been evaluated on different benchmark datasets.
Whereas survey papers on RGB-D and point cloud segmentation exist, there is a
lack of an in-depth and recent survey that covers all 3D data modalities and
application domains. This paper fills the gap and provides a comprehensive
survey of the recent progress made in deep learning based 3D segmentation. It
covers over 180 works, analyzes their strengths and limitations and discusses
their competitive results on benchmark datasets. The survey provides a summary
of the most commonly used pipelines and finally highlights promising research
directions for the future.
- Abstract(参考訳): 3dセグメンテーションは、自律運転、ロボティクス、拡張現実、医療画像解析などの応用を含む、コンピュータビジョンにおける基本的かつ困難な問題である。
コンピュータビジョン、グラフィックス、機械学習のコミュニティから大きな注目を集めている。
手作り特徴と機械学習分類器に基づく従来の3Dセグメンテーション手法では、一般化能力が欠如している。
2Dコンピュータビジョンの成功によって、ディープラーニング技術は、最近3Dセグメンテーションタスクの選択ツールとなっている。
これにより、さまざまなベンチマークデータセットで評価された多くの方法が文献に流入した。
RGB-Dとポイントクラウドのセグメンテーションに関する調査論文は存在するが、すべての3Dデータモダリティとアプリケーションドメインをカバーする詳細な調査や最近の調査は存在しない。
本稿では,このギャップを埋め,ディープラーニングに基づく3Dセグメンテーションにおける最近の進歩を包括的に調査する。
180以上の作品をカバーし、強みと限界を分析し、ベンチマークデータセットでの競争力について論じている。
この調査は、最も一般的に使用されているパイプラインの概要を提供し、最終的に将来有望な研究方向性を強調している。
関連論文リスト
- SAM-guided Graph Cut for 3D Instance Segmentation [63.797612618531346]
本稿では,3次元画像情報と多視点画像情報の同時利用による3次元インスタンス分割の課題に対処する。
本稿では,3次元インスタンスセグメンテーションのための2次元セグメンテーションモデルを効果的に活用する新しい3D-to-2Dクエリフレームワークを提案する。
本手法は,ロバストなセグメンテーション性能を実現し,異なるタイプのシーンにまたがる一般化を実現する。
論文 参考訳(メタデータ) (2023-12-13T18:59:58Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - PartSLIP: Low-Shot Part Segmentation for 3D Point Clouds via Pretrained
Image-Language Models [56.324516906160234]
一般化可能な3D部分分割は重要だが、ビジョンとロボティクスでは難しい。
本稿では,事前学習した画像言語モデルGLIPを利用して,3次元点雲の低ショット部分分割法を提案する。
我々は2Dから3Dへの豊富な知識を、ポイントクラウドレンダリングにおけるGLIPに基づく部分検出と新しい2D-to-3Dラベルリフトアルゴリズムにより転送する。
論文 参考訳(メタデータ) (2022-12-03T06:59:01Z) - Towards Open Set 3D Learning: A Benchmark on Object Point Clouds [17.145309633743747]
本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
論文 参考訳(メタデータ) (2022-07-23T17:00:45Z) - 3D AffordanceNet: A Benchmark for Visual Object Affordance Understanding [33.68455617113953]
本稿では,23のセマンティックオブジェクトカテゴリから23kの形状のベンチマークである3D AffordanceNetデータセットについて述べる。
3つの最先端のポイントクラウドディープラーニングネットワークがすべてのタスクで評価されます。
論文 参考訳(メタデータ) (2021-03-30T14:46:27Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Deep Learning for 3D Point Cloud Understanding: A Survey [16.35767262996978]
自律運転やロボティクスといった実用アプリケーションの開発は、3Dポイントのクラウド理解に注意を向けている。
ディープラーニングは、画像ベースのタスクにおいて顕著な成功を収めていますが、大規模で非構造的でノイズの多い3Dポイントを処理する際に、ディープニューラルネットワークが直面する多くのユニークな課題があります。
本稿では,この領域における最近の顕著な研究成果を,いくつかの方向から要約する。
論文 参考訳(メタデータ) (2020-09-18T16:34:12Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z) - Are We Hungry for 3D LiDAR Data for Semantic Segmentation? A Survey and
Experimental Study [5.6780397318769245]
3Dセマンティックセグメンテーションは、ロボットおよび自律運転アプリケーションの基本課題である。
最近の研究はディープラーニング技術の利用に重点を置いているが、細かな注釈付き3DLiDARデータセットの開発は非常に労働集約的である。
不十分なデータセットによって引き起こされるパフォーマンスの制限は、データ飢餓問題と呼ばれる。
論文 参考訳(メタデータ) (2020-06-08T01:20:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。