論文の概要: SCPNet: Semantic Scene Completion on Point Cloud
- arxiv url: http://arxiv.org/abs/2303.06884v1
- Date: Mon, 13 Mar 2023 06:03:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 16:15:00.656890
- Title: SCPNet: Semantic Scene Completion on Point Cloud
- Title(参考訳): SCPNet: Point Cloudでのセマンティックシーン補完
- Authors: Zhaoyang Xia, Youquan Liu, Xin Li, Xinge Zhu, Yuexin Ma, Yikang Li,
Yuenan Hou, Yu Qiao
- Abstract要約: セマンティックシーン補完のための深層モデル(SSC)の訓練は、スパース入力と不完全入力のために困難である。
マルチスケールな特徴を集約する新しいサブネットワークを設計し、損失の少ないダウンサンプリング操作を不要とする。
そこで本研究では,既設のパノプティクス・セグメンテーション・ラベルを用いて,動的オブジェクトのトレースを除去する簡易かつ効果的なラベル修正手法を提案する。
- 参考スコア(独自算出の注目度): 38.029386594416394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training deep models for semantic scene completion (SSC) is challenging due
to the sparse and incomplete input, a large quantity of objects of diverse
scales as well as the inherent label noise for moving objects. To address the
above-mentioned problems, we propose the following three solutions: 1)
Redesigning the completion sub-network. We design a novel completion
sub-network, which consists of several Multi-Path Blocks (MPBs) to aggregate
multi-scale features and is free from the lossy downsampling operations. 2)
Distilling rich knowledge from the multi-frame model. We design a novel
knowledge distillation objective, dubbed Dense-to-Sparse Knowledge Distillation
(DSKD). It transfers the dense, relation-based semantic knowledge from the
multi-frame teacher to the single-frame student, significantly improving the
representation learning of the single-frame model. 3) Completion label
rectification. We propose a simple yet effective label rectification strategy,
which uses off-the-shelf panoptic segmentation labels to remove the traces of
dynamic objects in completion labels, greatly improving the performance of deep
models especially for those moving objects. Extensive experiments are conducted
in two public SSC benchmarks, i.e., SemanticKITTI and SemanticPOSS. Our SCPNet
ranks 1st on SemanticKITTI semantic scene completion challenge and surpasses
the competitive S3CNet by 7.2 mIoU. SCPNet also outperforms previous completion
algorithms on the SemanticPOSS dataset. Besides, our method also achieves
competitive results on SemanticKITTI semantic segmentation tasks, showing that
knowledge learned in the scene completion is beneficial to the segmentation
task.
- Abstract(参考訳): セマンティックシーン補完のための深層モデル(SSC)の訓練は、スパースで不完全な入力、多様なスケールの大量のオブジェクト、移動物体に固有のラベルノイズにより困難である。
上記の問題に対処するため、以下の3つの解決策を提案する。
1) 完了サブネットワークの再設計。
複数のマルチパスブロック(MPB)から構成される新しいサブネットワークを設計し、マルチスケールな特徴を集約し、損失の少ないダウンサンプリング操作を不要とする。
2)マルチフレームモデルから豊富な知識を抽出する。
我々はDense-to-Sparse Knowledge Distillation (DSKD)と呼ばれる新しい知識蒸留目標を設計する。
密集した関係に基づく意味知識を多フレームの教師から単フレームの生徒に伝達し、単フレームモデルの表現学習を大幅に改善する。
3) 完了ラベルの修正。
そこで,本研究では, 既設のパノプティック・セグメンテーション・ラベルを用いて, 完了ラベル中の動的物体の痕跡を除去し, 特に移動物体の深部モデルの性能を大幅に向上させる, 簡易かつ効果的なラベル修正戦略を提案する。
大規模な実験は2つの公開SSCベンチマーク、すなわちSemanticKITTIとSemanticPOSSで実施される。
我々のSCPNetはセマンティックKITTIセマンティックシーンコンプリートチャレンジで1位であり、競合するS3CNetを7.2mIoUで上回っている。
SCPNetはまた、SemanticPOSSデータセットで以前の補完アルゴリズムよりも優れている。
また,semantickittiセマンティックセグメンテーションタスクにおける競合結果も達成し,セグメンテーションタスクにおいてシーン補完で学習した知識が有益であることを示す。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Semantic-SAM: Segment and Recognize Anything at Any Granularity [83.64686655044765]
本稿では,任意の粒度でセグメンテーションと認識を可能にする汎用画像セグメンテーションモデルであるSemantic-SAMを紹介する。
複数のデータセットを3つの粒度に集約し、オブジェクトとパーツの分離した分類を導入する。
マルチグラニュラリティ機能を実現するために,各クリックで複数のレベルのマスクを生成できるマルチ選択学習方式を提案する。
論文 参考訳(メタデータ) (2023-07-10T17:59:40Z) - AIMS: All-Inclusive Multi-Level Segmentation [93.5041381700744]
視覚領域を3つのレベル(パート、エンティティ、リレーション)に分割するタスクであるAll-Inclusive Multi-Level(AIMS)を提案する。
また、アノテーションの不整合とタスク相関の2つの大きな課題に対処するために、マルチデータセットのマルチタスクトレーニングを通じて統合されたAIMSモデルを構築します。
論文 参考訳(メタデータ) (2023-05-28T16:28:49Z) - Integrative Few-Shot Learning for Classification and Segmentation [37.50821005917126]
少数ショット分類とセグメンテーション(FS-CS)の統合タスクについて紹介する。
FS-CSは、ターゲットクラスがいくつかの例で与えられるとき、クエリイメージでターゲットオブジェクトを分類し、セグメントすることを目的としている。
本稿では,FS-CSのための統合的数ショット学習フレームワークを提案し,学習者がクラスワイドな前景マップを構築するように訓練する。
論文 参考訳(メタデータ) (2022-03-29T16:14:40Z) - Continual Coarse-to-Fine Domain Adaptation in Semantic Segmentation [22.366638308792734]
ディープニューラルネットワークは通常、特定のタスクとデータ分散のために、単一のショットでトレーニングされる。
実際の環境では、タスクとアプリケーションドメインの両方が変更される可能性がある。
本稿では,ドメインシフトが存在する場合のセマンティックセグメンテーションアーキテクチャの粗大な学習という新たな課題を紹介する。
論文 参考訳(メタデータ) (2022-01-18T13:31:19Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Empirical Study of Multi-Task Hourglass Model for Semantic Segmentation
Task [0.7614628596146599]
エッジ検出, 意味輪郭, 距離変換タスクを用いて, セマンティックセグメンテーションタスクを補完するマルチタスク手法を提案する。
本研究では,Cityscapes,CamVid,Freiburg Forestの各データセットにおける時間ガラスモデルのマルチタスク環境における学習の有効性を示す。
論文 参考訳(メタデータ) (2021-05-28T01:08:10Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - Multi-task GANs for Semantic Segmentation and Depth Completion with
Cycle Consistency [7.273142068778457]
本稿では, セマンティックセグメンテーションと深度補完に優れたマルチタスク生成対向ネットワーク(Multi-task GANs)を提案する。
本稿では,マルチスケール空間プーリングブロックと構造的類似性復元損失を導入することにより,CycleGANに基づく生成セマンティック画像の詳細を改善する。
CityscapesデータセットとKITTI深度補完ベンチマークの実験は、マルチタスクGANが競合性能を達成することができることを示している。
論文 参考訳(メタデータ) (2020-11-29T04:12:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。