論文の概要: Region-Enhanced Feature Learning for Scene Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2304.07486v2
- Date: Tue, 18 Apr 2023 01:50:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 11:24:12.872846
- Title: Region-Enhanced Feature Learning for Scene Semantic Segmentation
- Title(参考訳): シーンセマンティックセグメンテーションのための地域機能学習
- Authors: Xin Kang, Chaoqun Wang, Xuejin Chen
- Abstract要約: 本稿では,微細な点やボクセルの代わりに,点雲の中間表現として領域を用いることを提案する。
本稿では、領域相関を利用して曖昧な点の特徴を高める新しい領域拡張特徴学習ネットワーク(REFL-Net)を提案する。
我々のREFL-NetはScanNetv2で1.8% mIoU、S3DISデータセットで1.0% mIoUを得る。
- 参考スコア(独自算出の注目度): 26.173914279848095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation in complex scenes not only relies on local object
appearance but also on object locations and the surrounding environment.
Nonetheless, it is difficult to model long-range context in the format of
pairwise point correlations due to its huge computational cost for large-scale
point clouds. In this paper, we propose to use regions as the intermediate
representation of point clouds instead of fine-grained points or voxels to
reduce the computational burden. We introduce a novel Region-Enhanced Feature
Learning network (REFL-Net) that leverages region correlations to enhance the
features of ambiguous points. We design a Region-based Feature Enhancement
module (RFE) which consists of a Semantic-Spatial Region Extraction (SSRE)
stage and a Region Dependency Modeling (RDM) stage. In the SSRE stage, we group
the input points into a set of regions according to the point distances in both
semantic and spatial space. In the RDM part, we explore region-wise semantic
and spatial relationships via a self-attention block on region features and
fuse point features with the region features to obtain more discriminative
representations. Our proposed RFE module is a plug-and-play module that can be
integrated with common semantic segmentation backbones. We conduct extensive
experiments on ScanNetv2 and S3DIS datasets, and evaluate our RFE module with
different segmentation backbones. Our REFL-Net achieves 1.8% mIoU gain on
ScanNetv2 and 1.0% mIoU gain on S3DIS respectively with negligible
computational cost compared to the backbone networks. Both quantitative and
qualitative results show the powerful long-range context modeling ability and
strong generalization ability of our REFL-Net.
- Abstract(参考訳): 複雑なシーンにおける意味セグメンテーションは、局所的なオブジェクトの外観だけでなく、オブジェクトの位置や周囲の環境にも依存する。
それにもかかわらず、大規模ポイントクラウドの計算コストが大きいため、ペアワイズなポイント相関の形式で長距離コンテキストをモデル化することは困難である。
本稿では,計算負荷を軽減するために,細粒度点やボクセルではなく,点雲の中間表現として領域を用いることを提案する。
本稿では、領域相関を利用して曖昧な点の特徴を高める新しい領域拡張特徴学習ネットワーク(REFL-Net)を提案する。
本研究では,意味空間領域抽出 (SSRE) 段階と領域依存モデリング (RDM) 段階からなる領域ベース特徴拡張モジュール (RFE) を設計する。
ssreの段階では、入力点を意味空間と空間空間空間の両方の点距離に応じて一連の領域にグループ化する。
RDMでは,領域の特徴に対する自己注意ブロックと,領域の特徴と融合点特徴を用いて,地域的意味と空間的関係を探索し,より識別的な表現を得る。
提案するRFEモジュールは,一般的なセマンティックセグメンテーションバックボーンと統合可能なプラグイン・アンド・プレイモジュールである。
ScanNetv2とS3DISデータセットに関する広範な実験を行い、異なるセグメンテーションバックボーンでRFEモジュールを評価する。
我々のREFL-NetはScanNetv2の1.8% mIoUゲインとS3DISの1.0% mIoUゲインを、バックボーンネットワークと比較して無視できる計算コストで達成している。
定量的および定性的な結果から,refl-netの強力な長距離文脈モデリング能力と強汎化能力を示す。
関連論文リスト
- Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - Local region-learning modules for point cloud classification [0.0]
本研究では,各中心点に対する適切なシフトを推定し,各局所領域の半径を変化させる2つの局所学習モジュールを提案する。
どちらのモジュールも独立して、PointNet++とPointCNNオブジェクト分類アーキテクチャに統合しました。
ShapeNetデータセットを用いた実験の結果,モジュールは3次元CADモデルにも有効であることがわかった。
論文 参考訳(メタデータ) (2023-03-30T12:45:46Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - Refine and Represent: Region-to-Object Representation Learning [55.70715883351945]
本稿では、領域ベースとオブジェクト中心の事前学習を統一する領域対オブジェクト表現学習(R2O)を提案する。
R2Oは、エンコーダを訓練して、領域ベースのセグメントをオブジェクト中心のマスクに動的に洗練する。
ImageNetで事前トレーニングを行った後、R2Oモデルは教師なしオブジェクトセグメンテーションにおける既存の最先端技術を上回ることができる。
論文 参考訳(メタデータ) (2022-08-25T01:44:28Z) - PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。
領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。
形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文 参考訳(メタデータ) (2021-12-09T13:24:43Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - LRC-Net: Learning Discriminative Features on Point Clouds by Encoding
Local Region Contexts [65.79931333193016]
本稿では,LRC-Net(Local-Region-Context Network)を提案する。
LRC-Netは、局所領域内および周辺領域間の微粒なコンテキストを同時に符号化する。
その結果, LRC-Netは形状分類や形状分割の応用において最先端の手法と競合することがわかった。
論文 参考訳(メタデータ) (2020-03-18T14:34:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。