論文の概要: A Review and A Robust Framework of Data-Efficient 3D Scene Parsing with
Traditional/Learned 3D Descriptors
- arxiv url: http://arxiv.org/abs/2312.01262v1
- Date: Sun, 3 Dec 2023 02:51:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 18:19:06.924553
- Title: A Review and A Robust Framework of Data-Efficient 3D Scene Parsing with
Traditional/Learned 3D Descriptors
- Title(参考訳): 従来の3dディスクリプタを用いたデータ効率の良い3dシーン解析のレビューとロバストなフレームワーク
- Authors: Kangcheng Liu
- Abstract要約: 既存の最先端の3Dポイントクラウド理解手法は、完全に教師された方法でのみうまく機能する。
この研究は、ラベルが限定されている場合のポイントクラウド理解に取り組むための、汎用的でシンプルなフレームワークを提供する。
- 参考スコア(独自算出の注目度): 10.497309421830671
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing state-of-the-art 3D point cloud understanding methods merely perform
well in a fully supervised manner. To the best of our knowledge, there exists
no unified framework that simultaneously solves the downstream high-level
understanding tasks including both segmentation and detection, especially when
labels are extremely limited. This work presents a general and simple framework
to tackle point cloud understanding when labels are limited. The first
contribution is that we have done extensive methodology comparisons of
traditional and learned 3D descriptors for the task of weakly supervised 3D
scene understanding, and validated that our adapted traditional PFH-based 3D
descriptors show excellent generalization ability across different domains. The
second contribution is that we proposed a learning-based region merging
strategy based on the affinity provided by both the traditional/learned 3D
descriptors and learned semantics. The merging process takes both low-level
geometric and high-level semantic feature correlations into consideration.
Experimental results demonstrate that our framework has the best performance
among the three most important weakly supervised point clouds understanding
tasks including semantic segmentation, instance segmentation, and object
detection even when very limited number of points are labeled. Our method,
termed Region Merging 3D (RM3D), has superior performance on ScanNet
data-efficient learning online benchmarks and other four large-scale 3D
understanding benchmarks under various experimental settings, outperforming
current arts by a margin for various 3D understanding tasks without complicated
learning strategies such as active learning.
- Abstract(参考訳): 既存の最先端の3Dポイントクラウド理解手法は、完全に教師された方法でのみうまく機能する。
我々の知る限りでは、特にラベルが極端に制限されている場合、セグメンテーションと検出の両方を含む下流高レベル理解タスクを同時に解決する統一的なフレームワークは存在しない。
この作業は、ラベルが制限された場合のポイントクラウド理解に取り組むための汎用的でシンプルなフレームワークを提供する。
第1の貢献は、3Dシーン理解の弱い課題に対して、従来の3D記述子と学習した3D記述子を広範囲に方法論的に比較し、従来のPFHベースの3D記述子が異なる領域にまたがって優れた一般化能力を示すことを検証することである。
第2の貢献は,従来の3次元記述子と学習意味論の両方が提供する親和性に基づく学習ベースの領域統合戦略を提案することである。
マージプロセスは、低レベルの幾何学的特徴と高レベルの意味的特徴の相関を考慮に入れている。
実験の結果,非常に限られた数の点がラベル付けされた場合でも,セマンティクスセグメンテーションやインスタンスセグメンテーション,オブジェクト検出などのタスクを理解する,最も重要な3つの弱教師付きポイントクラウドの中で,フレームワークが最高のパフォーマンスを示している。
提案手法は,ScanNetデータ効率学習オンラインベンチマークや,各種実験環境下での大規模3D理解ベンチマークにおいて,積極的学習などの複雑な学習戦略を伴わずに,様々な3D理解タスクのマージンにおいて,現在の芸術性を上回る性能を有する。
関連論文リスト
- Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis [39.85109385954641]
近年の研究では、パラメータ効率のよいプロンプトチューニングにより、3次元点雲認識の性能が著しく向上できることが示されている。
本稿では,学習可能なプロンプトが大規模3次元モデルにおいて,よく学習された一般知識と積極的に対話することを可能にする包括的規制フレームワークを提案する。
意外なことに,本手法は,一貫した一般化能力の向上だけでなく,様々な3DDGベンチマークにおけるタスク固有の3D認識性能を明確なマージンで向上させる。
論文 参考訳(メタデータ) (2024-10-27T10:35:47Z) - A Data-efficient Framework for Robotics Large-scale LiDAR Scene Parsing [10.497309421830671]
既存の最先端の3Dポイントクラウド理解手法は、完全に教師された方法でのみうまく機能する。
この研究は、ラベルが制限されているときのポイントクラウドを理解するための、汎用的でシンプルなフレームワークを提示している。
論文 参考訳(メタデータ) (2023-12-03T02:38:51Z) - Generalized Label-Efficient 3D Scene Parsing via Hierarchical Feature
Aligned Pre-Training and Region-Aware Fine-tuning [55.517000360348725]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
室内と屋外の両方で実験を行ったところ、データ効率のよい学習とオープンワールドの複数ショット学習の両方において、我々のアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-12-01T15:47:04Z) - Cross-modal and Cross-domain Knowledge Transfer for Label-free 3D
Segmentation [23.110443633049382]
本稿では,画像と点雲の関係を網羅的に探究することで,クロスモーダル・クロスドメイン適応に挑戦する新しい手法を提案する。
KITTI360 と GTA5 の知識を用いて,セマンティック KITTI 上の3次元クラウドセマンティックセマンティックセマンティックスセグメンテーションの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-19T14:29:57Z) - SL3D: Self-supervised-Self-labeled 3D Recognition [89.19932178712065]
自己教師付き自己ラベル型3D認識(SL3D)フレームワークを提案する。
SL3Dはクラスタリングと学習機能表現という2つの結合した目的を同時に解決する。
分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな3D認識タスクに応用することができる。
論文 参考訳(メタデータ) (2022-10-30T11:08:25Z) - 3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。
We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文 参考訳(メタデータ) (2021-05-13T17:58:07Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。