論文の概要: Retro-FPN: Retrospective Feature Pyramid Network for Point Cloud
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2308.09314v1
- Date: Fri, 18 Aug 2023 05:28:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 14:27:51.073539
- Title: Retro-FPN: Retrospective Feature Pyramid Network for Point Cloud
Semantic Segmentation
- Title(参考訳): retro-fpn: ポイントクラウドセマンティクスセグメンテーションのための振り返り機能ピラミッドネットワーク
- Authors: Peng Xiang, Xin Wen, Yu-Shen Liu, Hui Zhang, Yi Fang, Zhizhong Han
- Abstract要約: 本稿では,各点特徴量の予測を明示的かつふりかえり的な精錬プロセスとしてモデル化するRetro-FPNを提案する。
その重要な斬新さは、前層から意味コンテキストを要約するレトロ・トランスフォーマーである。
Retro-FPNは最先端のバックボーンよりも性能が大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 65.78483246139888
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning per-point semantic features from the hierarchical feature pyramid is
essential for point cloud semantic segmentation. However, most previous methods
suffered from ambiguous region features or failed to refine per-point features
effectively, which leads to information loss and ambiguous semantic
identification. To resolve this, we propose Retro-FPN to model the per-point
feature prediction as an explicit and retrospective refining process, which
goes through all the pyramid layers to extract semantic features explicitly for
each point. Its key novelty is a retro-transformer for summarizing semantic
contexts from the previous layer and accordingly refining the features in the
current stage. In this way, the categorization of each point is conditioned on
its local semantic pattern. Specifically, the retro-transformer consists of a
local cross-attention block and a semantic gate unit. The cross-attention
serves to summarize the semantic pattern retrospectively from the previous
layer. And the gate unit carefully incorporates the summarized contexts and
refines the current semantic features. Retro-FPN is a pluggable neural network
that applies to hierarchical decoders. By integrating Retro-FPN with three
representative backbones, including both point-based and voxel-based methods,
we show that Retro-FPN can significantly improve performance over
state-of-the-art backbones. Comprehensive experiments on widely used benchmarks
can justify the effectiveness of our design. The source is available at
https://github.com/AllenXiangX/Retro-FPN
- Abstract(参考訳): ポイントごとのセマンティックな特徴を階層的な特徴ピラミッドから学ぶことは、ポイントクラウドセマンティックセグメンテーションに不可欠である。
しかし、以前のほとんどの方法は曖昧な領域の特徴に苦しめられたり、ポイント単位の機能を効果的に洗練できなかったりするなど、情報の喪失と曖昧な意味の識別に繋がる。
この問題を解決するために,我々は,すべてのピラミッド層を通り抜けて各点の意味的特徴を明示的に抽出する明示的かつふりかえり的な改良プロセスとして,ポイント毎の機能予測をモデル化するレトロfpnを提案する。
その重要な斬新さは、前層から意味的コンテキストを要約し、現在の段階での機能を精細化するレトロトランスフォーマーである。
このように、各点の分類は局所的な意味パターンに基づいている。
具体的には、レトロトランスは、局所的なクロスアテンションブロックとセマンティックゲートユニットから構成される。
クロスアテンションは、前層から振り返ってセマンティックパターンを要約するのに役立ちます。
そしてゲートユニットは、要約されたコンテキストを注意深く取り入れ、現在の意味的特徴を洗練します。
Retro-FPNは階層型デコーダに適用可能なプラグイン可能なニューラルネットワークである。
Retro-FPNを3つの代表的なバックボーン(ポイントベースとボクセルベースの両方)と統合することにより、Retro-FPNは最先端のバックボーンよりも性能を大幅に向上させることができることを示す。
広く使われているベンチマークに関する包括的な実験は、設計の有効性を正当化します。
ソースはhttps://github.com/allenxiangx/retro-fpnで入手できる。
関連論文リスト
- Position-Guided Point Cloud Panoptic Segmentation Transformer [118.17651196656178]
この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。
スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。
position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Feature-Proxy Transformer for Few-Shot Segmentation [35.85575258482071]
Few-shot segmentation (FSS) は、いくつかのアノテーション付きサポートサンプルが与えられた新しいクラスでセマンティックセマンティックセマンティックセマンティクスを実行することを目的としている。
本稿では、線形分類ヘッドのセマンティッククラスを表すベクトルである「プロキシ」を特徴量変換器(FPTrans)法を提案する。
フレームワークは単純だが、FPTransは最先端デコーダ方式と同等に競合するFSS精度を実現する。
論文 参考訳(メタデータ) (2022-10-13T11:22:27Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - SE(3)-Equivariant Attention Networks for Shape Reconstruction in
Function Space [50.14426188851305]
本稿では,第1のSE(3)-equivariant coordinate-based networkを提案する。
入力を正規格子に整列させる従来の形状再構成法とは対照的に、不規則で無向な点雲を直接操作する。
提案手法は,従来のSO(3)-equivariant法,およびSO(3)-augmented dataで訓練された非equivariant法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:15Z) - REGTR: End-to-end Point Cloud Correspondences with Transformers [79.52112840465558]
我々は、注意機構が明示的な特徴マッチングとRANSACの役割を置き換えることができると推測する。
本稿では,最終文集合を直接予測するエンドツーエンドフレームワークを提案する。
提案手法は3DMatchおよびModelNetベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T06:01:00Z) - Point Cloud Registration using Representative Overlapping Points [10.843159482657303]
本稿では,登録のための識別機能を備えた代表オーバーラップポイントを用いた新しいディープラーニングモデル ROPNetを提案する。
具体的には,エンコーダを用いてポイントオーバーラップスコアの予測にグローバルな特徴を抽出するコンテキスト誘導モジュールを提案する。
ノイズと部分重なり合う点雲を用いたModelNet40上での実験により,提案手法が従来の学習手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-07-06T12:52:22Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - OMNet: Learning Overlapping Mask for Partial-to-Partial Point Cloud
Registration [31.108056345511976]
OMNetは、部分から部分へのポイントクラウド登録のためのグローバル機能ベースの反復ネットワークです。
マスクを粗雑に学習し,重複しない領域を拒絶し,部分から部分への登録を同一形状の登録に変換する。
論文 参考訳(メタデータ) (2021-03-01T11:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。