論文の概要: Are We Hungry for 3D LiDAR Data for Semantic Segmentation? A Survey and
Experimental Study
- arxiv url: http://arxiv.org/abs/2006.04307v2
- Date: Mon, 30 Nov 2020 12:58:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 01:51:46.823893
- Title: Are We Hungry for 3D LiDAR Data for Semantic Segmentation? A Survey and
Experimental Study
- Title(参考訳): セマンティックセグメンテーションのための3次元LiDARデータについて
調査と実験研究
- Authors: Biao Gao, Yancheng Pan, Chengkun Li, Sibo Geng, Huijing Zhao
- Abstract要約: 3Dセマンティックセグメンテーションは、ロボットおよび自律運転アプリケーションの基本課題である。
最近の研究はディープラーニング技術の利用に重点を置いているが、細かな注釈付き3DLiDARデータセットの開発は非常に労働集約的である。
不十分なデータセットによって引き起こされるパフォーマンスの制限は、データ飢餓問題と呼ばれる。
- 参考スコア(独自算出の注目度): 5.6780397318769245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D semantic segmentation is a fundamental task for robotic and autonomous
driving applications. Recent works have been focused on using deep learning
techniques, whereas developing fine-annotated 3D LiDAR datasets is extremely
labor intensive and requires professional skills. The performance limitation
caused by insufficient datasets is called data hunger problem. This research
provides a comprehensive survey and experimental study on the question: are we
hungry for 3D LiDAR data for semantic segmentation? The studies are conducted
at three levels. First, a broad review to the main 3D LiDAR datasets is
conducted, followed by a statistical analysis on three representative datasets
to gain an in-depth view on the datasets' size and diversity, which are the
critical factors in learning deep models. Second, a systematic review to the
state-of-the-art 3D semantic segmentation is conducted, followed by experiments
and cross examinations of three representative deep learning methods to find
out how the size and diversity of the datasets affect deep models' performance.
Finally, a systematic survey to the existing efforts to solve the data hunger
problem is conducted on both methodological and dataset's viewpoints, followed
by an insightful discussion of remaining problems and open questions To the
best of our knowledge, this is the first work to analyze the data hunger
problem for 3D semantic segmentation using deep learning techniques that are
addressed in the literature review, statistical analysis, and cross-dataset and
cross-algorithm experiments. We share findings and discussions, which may lead
to potential topics in future works.
- Abstract(参考訳): 3Dセマンティックセグメンテーションは、ロボットおよび自律運転アプリケーションの基本課題である。
近年,詳細な3次元LiDARデータセットの開発は極めて労働集約的であり,専門的なスキルを必要としている。
不十分なデータセットによって引き起こされるパフォーマンスの制限は、データ飢餓問題と呼ばれる。
この研究は、セマンティックセグメンテーションのための3D LiDARデータに飢えがあるか?
研究は3段階で行われる。
まず、主要な3dlidarデータセットの広範なレビューを行い、次に、3つの代表的なデータセットに関する統計分析を行い、深層モデルを学ぶ上で重要な要素であるデータセットのサイズと多様性について深い視点を得る。
第2に,最先端の3次元セマンティクスセグメンテーションを体系的にレビューし,次に3つの代表的なディープラーニング手法の実験と横断試験を行い,データセットのサイズと多様性がディープモデルのパフォーマンスにどのように影響するかを明らかにする。
最後に,既存のデータ飢餓問題の解決に向けた体系的な調査を,方法論とデータセットの両面から実施し,残る問題とオープンな質問に関する洞察に富んだ議論を行った。私たちの知識の最大限に活用するために,文献レビュー,統計解析,クロスデータセットおよびクロスアルゴリズム実験において,ディープラーニング技術を用いて3次元セマンティックセグメンテーションのためのデータ飢餓問題を解析する最初の試みである。
我々は発見と議論を共有しており、将来の作業において潜在的なトピックにつながる可能性がある。
関連論文リスト
- MetaFood3D: Large 3D Food Object Dataset with Nutrition Values [53.24500333363066]
このデータセットは、詳細な栄養情報、体重、および包括的栄養データベースに関連付けられた食品コードを含む、108カテゴリにわたる637の細かな3D食品オブジェクトから成っている。
実験の結果、我々のデータセットがアルゴリズムの性能を向上させる重要な可能性を実証し、ビデオキャプチャと3Dスキャンされたデータの間の困難さを強調し、高品質なデータ生成、シミュレーション、拡張におけるMetaFood3Dデータセットの強みを示した。
論文 参考訳(メタデータ) (2024-09-03T15:02:52Z) - Advancing 3D Point Cloud Understanding through Deep Transfer Learning: A Comprehensive Survey [3.929140365559557]
本稿では,ディープラーニング(DTL)とドメイン適応(DA)を用いた最新の3DPC理解手法について概観する。
本稿では,3DPCオブジェクト検出,セマンティックラベリング,セグメンテーション,分類,登録,ダウンサンプリング/アップサンプリング,デノナイズなど,さまざまな応用について述べる。
論文 参考訳(メタデータ) (2024-07-25T08:47:27Z) - Deep Learning-Based 3D Instance and Semantic Segmentation: A Review [0.0]
3Dセグメンテーションは、かなり冗長性があり、サンプル密度が変動し、組織が不足しているため、ポイントクラウドデータでは困難である。
ディープラーニングは、一般的なAI手法として、2次元視覚領域のスペクトルにうまく使われてきた。
本研究では3Dインスタンスとセマンティックセグメンテーションに提示された多くの戦略について検討する。
論文 参考訳(メタデータ) (2024-06-19T07:56:14Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - A Review and Roadmap of Deep Causal Model from Different Causal
Structures and Representations [23.87336875544181]
我々は因果データを,定値データ,半定値データ,不定値データという3つのカテゴリに再定義する。
定値データとは、従来の因果的シナリオで使用される統計データであり、半定値データは、ディープラーニングにドイツのデータフォーマットのスペクトルを指す。
不確定データは、我々のデータフォームの進行から推定される創発的な研究領域である。
論文 参考訳(メタデータ) (2023-11-02T01:31:42Z) - Advanced Data Augmentation Approaches: A Comprehensive Survey and Future
directions [57.30984060215482]
データ拡張の背景、レビューされたデータ拡張技術の新しい包括的分類法、および各技術の強さと弱点(可能ならば)を提供する。
また、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの3つの一般的なコンピュータビジョンタスクに対して、データ拡張効果の総合的な結果を提供する。
論文 参考訳(メタデータ) (2023-01-07T11:37:32Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - Deep Depth Completion: A Survey [26.09557446012222]
我々は、読者が研究動向をよりよく把握し、現在の進歩を明確に理解するのに役立つ総合的な文献レビューを提供する。
ネットワークアーキテクチャ,損失関数,ベンチマークデータセット,学習戦略の設計面から,関連する研究について検討する。
室内および屋外のデータセットを含む,広く使用されている2つのベンチマークデータセットに対して,モデル性能の定量的比較を行った。
論文 参考訳(メタデータ) (2022-05-11T08:24:00Z) - Deep Learning Based 3D Segmentation: A Survey [42.44509605101214]
3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。
近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。
本稿では,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2021-03-09T13:58:35Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。