Fugu-MT 論文翻訳(概要): Deep Learning Based 3D Segmentation: A Survey

論文の概要: Deep Learning Based 3D Segmentation: A Survey

arxiv url: http://arxiv.org/abs/2103.05423v5
Date: Tue, 17 Sep 2024 02:48:38 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-18 11:25:49.175599
Title: Deep Learning Based 3D Segmentation: A Survey
Title（参考訳）: ディープラーニングに基づく3Dセグメンテーション:サーベイ
Authors: Yong He, Hongshan Yu, Xiaoyan Liu, Zhengeng Yang, Wei Sun, Saeed Anwar, Ajmal Mian,
Abstract要約: 3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。本稿では,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。
参考スコア（独自算出の注目度）: 42.44509605101214
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 3D segmentation is a fundamental and challenging problem in computer vision with applications in autonomous driving and robotics. It has received significant attention from the computer vision, graphics and machine learning communities. Conventional methods for 3D segmentation, based on hand-crafted features and machine learning classifiers, lack generalization ability. Driven by their success in 2D computer vision, deep learning techniques have recently become the tool of choice for 3D segmentation tasks. This has led to an influx of many methods in the literature that have been evaluated on different benchmark datasets. Whereas survey papers on RGB-D and point cloud segmentation exist, there is a lack of a recent in-depth survey that covers all 3D data modalities and application domains. This paper fills the gap and comprehensively surveys the recent progress in deep learning-based 3D segmentation techniques. We cover over 220 works from the last six years, analyze their strengths and limitations, and discuss their competitive results on benchmark datasets. The survey provides a summary of the most commonly used pipelines and finally highlights promising research directions for the future.
Abstract（参考訳）: 3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。コンピュータビジョン、グラフィックス、機械学習のコミュニティから大きな注目を集めている。手作りの特徴と機械学習の分類器に基づく従来の3Dセグメンテーション手法は、一般化能力に欠けていた。 2Dコンピュータビジョンの成功によって、ディープラーニング技術は、最近3Dセグメンテーションタスクの選択ツールとなっている。この結果、さまざまなベンチマークデータセットで評価された文献に多くのメソッドが流入した。 RGB-Dとポイントクラウドセグメンテーションに関する調査論文は存在するが、最近の詳細な調査では、すべての3Dデータモダリティとアプリケーションドメインをカバーしている。本稿では,このギャップを埋め,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。過去6年間の220以上の作品をカバーし、その強みと制限を分析し、ベンチマークデータセット上での競合結果について議論する。この調査は、最も一般的に使用されているパイプラインの概要を提供し、最終的に将来有望な研究方向性を強調している。

関連論文リスト

PartNeXt: A Next-Generation Dataset for Fine-Grained and Hierarchical 3D Part Understanding [65.55036443711528]
PartNeXtは、23,000以上の高品質なテクスチャ付き3Dモデルを持つ次世代データセットで、50のカテゴリにわたるきめ細かな階層的なパーツラベルがアノテートされている。そこで我々は,(1)クラス非依存な部分分割,最先端の手法が細粒度や葉のレベルに苦しむ部分分割,(2)3D部分中心の質問応答,(3)オープン語彙の部分接地における大きなギャップを明らかにする3D-LLMsの新しいベンチマークの2つのタスクについて,PartNeXtをベンチマークした。
論文参考訳（メタデータ） (2025-10-23T03:06:08Z)
E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。 GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文参考訳（メタデータ） (2025-06-02T17:53:09Z)
3D Instance Segmentation Using Deep Learning on RGB-D Indoor Data [0.0]
2次元領域をベースとした畳み込みニューラルネットワーク(Mask R-CNN)深層学習モデルにポイントベースレンダリングモジュールを適用し,深度情報と統合してオブジェクトの3Dインスタンスを認識し,セグメント化する。 3Dポイントクラウド座標を生成するために、RGB画像内の認識対象領域のセグメンテーションされた2Dピクセルを奥行き画像の(u,v)ポイントにマージする。
論文参考訳（メタデータ） (2024-06-19T08:00:35Z)
Deep Learning-Based 3D Instance and Semantic Segmentation: A Review [0.0]
3Dセグメンテーションは、かなり冗長性があり、サンプル密度が変動し、組織が不足しているため、ポイントクラウドデータでは困難である。ディープラーニングは、一般的なAI手法として、2次元視覚領域のスペクトルにうまく使われてきた。本研究では3Dインスタンスとセマンティックセグメンテーションに提示された多くの戦略について検討する。
論文参考訳（メタデータ） (2024-06-19T07:56:14Z)
TS40K: a 3D Point Cloud Dataset of Rural Terrain and Electrical Transmission System [39.244727514293324]
TS40Kは欧州の農村部にある電気通信システムで4万Kmを超える3Dポイントクラウドデータセットである。これは、電力グリッド検査のリスクの高いミッションを支援する研究コミュニティにとって、新しい問題であるだけでなく、自動運転や屋内の3Dデータとは異なる特徴を持つ3Dポイントクラウドも提供する。本研究では,3次元セマンティックセグメンテーションと3次元オブジェクト検出に関するデータセット上での最先端手法の性能を評価する。
論文参考訳（メタデータ） (2024-05-22T20:53:23Z)
SAI3D: Segment Any Instance in 3D Scenes [68.57002591841034]
新規なゼロショット3Dインスタンスセグメンテーション手法であるSAI3Dを紹介する。我々の手法は3Dシーンを幾何学的プリミティブに分割し、段階的に3Dインスタンスセグメンテーションにマージする。 ScanNet、Matterport3D、さらに難しいScanNet++データセットに関する実証的な評価は、我々のアプローチの優位性を示している。
論文参考訳（メタデータ） (2023-12-17T09:05:47Z)
SAM-guided Graph Cut for 3D Instance Segmentation [60.75119991853605]
本稿では,3次元画像情報と多視点画像情報の同時利用による3次元インスタンス分割の課題に対処する。本稿では,3次元インスタンスセグメンテーションのための2次元セグメンテーションモデルを効果的に活用する新しい3D-to-2Dクエリフレームワークを提案する。本手法は,ロバストなセグメンテーション性能を実現し,異なるタイプのシーンにまたがる一般化を実現する。
論文参考訳（メタデータ） (2023-12-13T18:59:58Z)
Leveraging Large-Scale Pretrained Vision Foundation Models for Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文参考訳（メタデータ） (2023-11-03T15:41:15Z)
Towards Open Set 3D Learning: A Benchmark on Object Point Clouds [17.145309633743747]
本論文は,オープンセット3次元学習に関する第1報である。カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
論文参考訳（メタデータ） (2022-07-23T17:00:45Z)
Improving Point Cloud Semantic Segmentation by Learning 3D Object Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。 Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文参考訳（メタデータ） (2020-09-22T14:17:40Z)
Deep Learning for 3D Point Cloud Understanding: A Survey [16.35767262996978]
自律運転やロボティクスといった実用アプリケーションの開発は、3Dポイントのクラウド理解に注意を向けている。ディープラーニングは、画像ベースのタスクにおいて顕著な成功を収めていますが、大規模で非構造的でノイズの多い3Dポイントを処理する際に、ディープニューラルネットワークが直面する多くのユニークな課題があります。本稿では,この領域における最近の顕著な研究成果を,いくつかの方向から要約する。
論文参考訳（メタデータ） (2020-09-18T16:34:12Z)
PointContrast: Unsupervised Pre-training for 3D Point Cloud Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文参考訳（メタデータ） (2020-07-21T17:59:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。