論文の概要: Deep Learning Based 3D Segmentation: A Survey
- arxiv url: http://arxiv.org/abs/2103.05423v3
- Date: Wed, 26 Jul 2023 08:14:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 16:51:30.806119
- Title: Deep Learning Based 3D Segmentation: A Survey
- Title(参考訳): ディープラーニングに基づく3次元セグメンテーション:調査
- Authors: Yong He, Hongshan Yu, Xiaoyan Liu, Zhengeng Yang, Wei Sun, Ajmal Mian
- Abstract要約: 3Dセグメンテーションは、自律運転、ロボティクス、拡張現実、医療画像解析などの応用において、コンピュータビジョンの基本的な問題である。
近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。
本稿では,このギャップを埋め,ディープラーニングに基づく3Dセグメンテーションにおける最近の進歩を包括的に調査する。
- 参考スコア(独自算出の注目度): 29.402585297221457
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D segmentation is a fundamental and challenging problem in computer vision
with applications in autonomous driving, robotics, augmented reality and
medical image analysis. It has received significant attention from the computer
vision, graphics and machine learning communities. Conventional methods for 3D
segmentation, based on hand-crafted features and machine learning classifiers,
lack generalization ability. Driven by their success in 2D computer vision,
deep learning techniques have recently become the tool of choice for 3D
segmentation tasks. This has led to an influx of a large number of methods in
the literature that have been evaluated on different benchmark datasets.
Whereas survey papers on RGB-D and point cloud segmentation exist, there is a
lack of an in-depth and recent survey that covers all 3D data modalities and
application domains. This paper fills the gap and provides a comprehensive
survey of the recent progress made in deep learning based 3D segmentation. It
covers over 180 works, analyzes their strengths and limitations and discusses
their competitive results on benchmark datasets. The survey provides a summary
of the most commonly used pipelines and finally highlights promising research
directions for the future.
- Abstract(参考訳): 3dセグメンテーションは、自律運転、ロボティクス、拡張現実、医療画像解析などの応用を含む、コンピュータビジョンにおける基本的かつ困難な問題である。
コンピュータビジョン、グラフィックス、機械学習のコミュニティから大きな注目を集めている。
手作り特徴と機械学習分類器に基づく従来の3Dセグメンテーション手法では、一般化能力が欠如している。
2Dコンピュータビジョンの成功によって、ディープラーニング技術は、最近3Dセグメンテーションタスクの選択ツールとなっている。
これにより、さまざまなベンチマークデータセットで評価された多くの方法が文献に流入した。
RGB-Dとポイントクラウドのセグメンテーションに関する調査論文は存在するが、すべての3Dデータモダリティとアプリケーションドメインをカバーする詳細な調査や最近の調査は存在しない。
本稿では,このギャップを埋め,ディープラーニングに基づく3Dセグメンテーションにおける最近の進歩を包括的に調査する。
180以上の作品をカバーし、強みと限界を分析し、ベンチマークデータセットでの競争力について論じている。
この調査は、最も一般的に使用されているパイプラインの概要を提供し、最終的に将来有望な研究方向性を強調している。
関連論文リスト
- 3D Instance Segmentation Using Deep Learning on RGB-D Indoor Data [0.0]
2次元領域をベースとした畳み込みニューラルネットワーク(Mask R-CNN)深層学習モデルにポイントベースレンダリングモジュールを適用し,深度情報と統合してオブジェクトの3Dインスタンスを認識し,セグメント化する。
3Dポイントクラウド座標を生成するために、RGB画像内の認識対象領域のセグメンテーションされた2Dピクセルを奥行き画像の(u,v)ポイントにマージする。
論文 参考訳(メタデータ) (2024-06-19T08:00:35Z) - Deep Learning-Based 3D Instance and Semantic Segmentation: A Review [0.0]
3Dセグメンテーションは、かなり冗長性があり、サンプル密度が変動し、組織が不足しているため、ポイントクラウドデータでは困難である。
ディープラーニングは、一般的なAI手法として、2次元視覚領域のスペクトルにうまく使われてきた。
本研究では3Dインスタンスとセマンティックセグメンテーションに提示された多くの戦略について検討する。
論文 参考訳(メタデータ) (2024-06-19T07:56:14Z) - TS40K: a 3D Point Cloud Dataset of Rural Terrain and Electrical Transmission System [39.244727514293324]
TS40Kは欧州の農村部にある電気通信システムで4万Kmを超える3Dポイントクラウドデータセットである。
これは、電力グリッド検査のリスクの高いミッションを支援する研究コミュニティにとって、新しい問題であるだけでなく、自動運転や屋内の3Dデータとは異なる特徴を持つ3Dポイントクラウドも提供する。
本研究では,3次元セマンティックセグメンテーションと3次元オブジェクト検出に関するデータセット上での最先端手法の性能を評価する。
論文 参考訳(メタデータ) (2024-05-22T20:53:23Z) - SAI3D: Segment Any Instance in 3D Scenes [68.57002591841034]
新規なゼロショット3Dインスタンスセグメンテーション手法であるSAI3Dを紹介する。
我々の手法は3Dシーンを幾何学的プリミティブに分割し、段階的に3Dインスタンスセグメンテーションにマージする。
ScanNet、Matterport3D、さらに難しいScanNet++データセットに関する実証的な評価は、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2023-12-17T09:05:47Z) - SAM-guided Graph Cut for 3D Instance Segmentation [60.75119991853605]
本稿では,3次元画像情報と多視点画像情報の同時利用による3次元インスタンス分割の課題に対処する。
本稿では,3次元インスタンスセグメンテーションのための2次元セグメンテーションモデルを効果的に活用する新しい3D-to-2Dクエリフレームワークを提案する。
本手法は,ロバストなセグメンテーション性能を実現し,異なるタイプのシーンにまたがる一般化を実現する。
論文 参考訳(メタデータ) (2023-12-13T18:59:58Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - Towards Open Set 3D Learning: A Benchmark on Object Point Clouds [17.145309633743747]
本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
論文 参考訳(メタデータ) (2022-07-23T17:00:45Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Deep Learning for 3D Point Cloud Understanding: A Survey [16.35767262996978]
自律運転やロボティクスといった実用アプリケーションの開発は、3Dポイントのクラウド理解に注意を向けている。
ディープラーニングは、画像ベースのタスクにおいて顕著な成功を収めていますが、大規模で非構造的でノイズの多い3Dポイントを処理する際に、ディープニューラルネットワークが直面する多くのユニークな課題があります。
本稿では,この領域における最近の顕著な研究成果を,いくつかの方向から要約する。
論文 参考訳(メタデータ) (2020-09-18T16:34:12Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。