論文の概要: Omni-supervised Point Cloud Segmentation via Gradual Receptive Field
Component Reasoning
- arxiv url: http://arxiv.org/abs/2105.10203v1
- Date: Fri, 21 May 2021 08:32:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:24:47.025778
- Title: Omni-supervised Point Cloud Segmentation via Gradual Receptive Field
Component Reasoning
- Title(参考訳): 直交場成分推論によるオムニ制御点雲分割
- Authors: Jingyu Gong, Jiachen Xu, Xin Tan, Haichuan Song, Yanyun Qu, Yuan Xie,
Lizhuang Ma
- Abstract要約: 提案した RFCR (Receptive Field Component Reasoning) を通したクラウドセグメンテーションに,最初のオムニスケール監視手法を導入する。
提案手法は,S3DIS と Semantic3D に対して新たな最先端性能を実現し,ScanNet ベンチマークの1位にランクインする。
- 参考スコア(独自算出の注目度): 41.83979510282989
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hidden features in neural network usually fail to learn informative
representation for 3D segmentation as supervisions are only given on output
prediction, while this can be solved by omni-scale supervision on intermediate
layers. In this paper, we bring the first omni-scale supervision method to
point cloud segmentation via the proposed gradual Receptive Field Component
Reasoning (RFCR), where target Receptive Field Component Codes (RFCCs) are
designed to record categories within receptive fields for hidden units in the
encoder. Then, target RFCCs will supervise the decoder to gradually infer the
RFCCs in a coarse-to-fine categories reasoning manner, and finally obtain the
semantic labels. Because many hidden features are inactive with tiny magnitude
and make minor contributions to RFCC prediction, we propose a Feature
Densification with a centrifugal potential to obtain more unambiguous features,
and it is in effect equivalent to entropy regularization over features. More
active features can further unleash the potential of our omni-supervision
method. We embed our method into four prevailing backbones and test on three
challenging benchmarks. Our method can significantly improve the backbones in
all three datasets. Specifically, our method brings new state-of-the-art
performances for S3DIS as well as Semantic3D and ranks the 1st in the ScanNet
benchmark among all the point-based methods. Code will be publicly available at
https://github.com/azuki-miho/RFCR.
- Abstract(参考訳): ニューラルネットワークの隠れた特徴は通常、3Dセグメンテーションの情報表現を学習するのに失敗する。
本稿では,提案する段階的受容的場成分推論(rfcr)を通じて,クラウドセグメンテーションをポイント化する最初の全規模監視手法を提案する。
次に、ターゲットRFCCがデコーダを監督し、粗いカテゴリの推論方法で徐々にRFCCを推論し、最終的に意味ラベルを取得する。
隠れた特徴の多くは小さな大きさで活動せず、RFCCの予測に小さな貢献をするので、より曖昧な特徴を得るための遠心電位を持つ特徴密度化を提案し、実質的には特徴のエントロピー正則化と等価である。
よりアクティブな機能は、omni-supervisionメソッドの可能性をさらに解き放つことができます。
従来の4つのバックボーンにメソッドを組み込んで,3つの難しいベンチマークでテストします。
提案手法は3つのデータセットのバックボーンを大幅に改善することができる。
具体的には,S3DIS と Semantic3D に最先端性能を導入し,ScanNet ベンチマークの1位にランクインする。
コードはhttps://github.com/azuki-miho/RFCR.comで公開される。
関連論文リスト
- FASTC: A Fast Attentional Framework for Semantic Traversability Classification Using Point Cloud [7.711666704468952]
点雲を用いたトラバーサビリティ評価の問題に対処する。
本稿では,垂直に配置された点雲から特徴を捉えるために PointNet を利用した柱状特徴抽出モジュールを提案する。
次に、LIDAR点雲の密度問題に適切に対応できる多フレーム情報を融合する新しい時間的アテンションモジュールを提案する。
論文 参考訳(メタデータ) (2024-06-24T12:01:55Z) - Multi-modality Affinity Inference for Weakly Supervised 3D Semantic
Segmentation [47.81638388980828]
本稿では,マルチモーダルポイント親和性推論モジュールを新たに導入した,シンプルで効果的なシーンレベルの弱教師付きポイントクラウドセグメンテーション法を提案する。
ScanNet と S3DIS のベンチマークでは,最先端の ScanNet と S3DIS のベンチマークでは 4% から 6% の mIoU を達成している。
論文 参考訳(メタデータ) (2023-12-27T14:01:35Z) - Learning Latent Part-Whole Hierarchies for Point Clouds [41.288934432615676]
本稿では,ポイントクラウドセグメンテーションのための部分階層を明示的に学習するエンコーダ-デコーダスタイルの潜在変数モデルを提案する。
提案手法は,トップレベル部分分割だけでなく,ミドルレベル潜在部分分割においても,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-11-14T03:17:33Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Dense Supervision Propagation for Weakly Supervised Semantic Segmentation on 3D Point Clouds [59.63231842439687]
意味点クラウドセグメンテーションネットワークをトレーニングする。
同様の特徴を伝達し、2つのサンプルにまたがる勾配を再現するクロスサンプル機能再配置モジュールを提案する。
ラベルの10%と1%しか持たない弱教師付き手法では、完全教師付き手法と互換性のある結果が得られる。
論文 参考訳(メタデータ) (2021-07-23T14:34:57Z) - (AF)2-S3Net: Attentive Feature Fusion with Adaptive Feature Selection
for Sparse Semantic Segmentation Network [3.6967381030744515]
3次元LiDARセマンティックセマンティックセグメンテーションのためのエンコーダ-デコーダCNNネットワークであるAF2-S3Netを提案する。
本稿では、エンコーダに新しいマルチブランチ注意機能融合モジュール、デコーダに特徴マップを再重み付けしたユニークな適応機能選択モジュールを提案する。
実験の結果,提案手法は大規模セマンティックKITTIベンチマークにおける最先端手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-02-08T21:04:21Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - Unsupervised Feedforward Feature (UFF) Learning for Point Cloud
Classification and Segmentation [57.62713515497585]
3次元点雲の連成分類とセグメンテーションのために,教師なしフィードフォワード特徴学習を提案する。
UFF法は、点雲セット内の点の統計的相関を利用して、1パスのフィードフォワード方式で形状と点の特徴を学習する。
エンコーダとローカルポイントでグローバルな形状の特徴を、エンコーダ-デコーダアーキテクチャを通して学習する。
論文 参考訳(メタデータ) (2020-09-02T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。