論文の概要: Region-Enhanced Feature Learning for Scene Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2304.07486v3
- Date: Wed, 17 Jan 2024 02:58:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 21:52:57.942991
- Title: Region-Enhanced Feature Learning for Scene Semantic Segmentation
- Title(参考訳): シーンセマンティックセグメンテーションのための地域機能学習
- Authors: Xin Kang, Chaoqun Wang, Xuejin Chen
- Abstract要約: 計算負担を軽減するために,細粒度点やボクセルの代わりに点雲の中間表現として領域を用いることを提案する。
本研究では,セマンティック空間領域抽出段階と領域依存モデリング段階からなるRFEモジュールを設計する。
我々のREFL-NetはScanNetV2で1.8% mIoUゲイン、S3DISデータセットで1.7% mIoUゲインを無視可能な計算コストで達成している。
- 参考スコア(独自算出の注目度): 19.20735517821943
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation in complex scenes relies not only on object appearance
but also on object location and the surrounding environment. Nonetheless, it is
difficult to model long-range context in the format of pairwise point
correlations due to the huge computational cost for large-scale point clouds.
In this paper, we propose using regions as the intermediate representation of
point clouds instead of fine-grained points or voxels to reduce the
computational burden. We introduce a novel Region-Enhanced Feature Learning
Network (REFL-Net) that leverages region correlations to enhance point feature
learning. We design a region-based feature enhancement (RFE) module, which
consists of a Semantic-Spatial Region Extraction stage and a Region Dependency
Modeling stage. In the first stage, the input points are grouped into a set of
regions based on their semantic and spatial proximity. In the second stage, we
explore inter-region semantic and spatial relationships by employing a
self-attention block on region features and then fuse point features with the
region features to obtain more discriminative representations. Our proposed RFE
module is plug-and-play and can be integrated with common semantic segmentation
backbones. We conduct extensive experiments on ScanNetV2 and S3DIS datasets and
evaluate our RFE module with different segmentation backbones. Our REFL-Net
achieves 1.8% mIoU gain on ScanNetV2 and 1.7% mIoU gain on S3DIS with
negligible computational cost compared with backbone models. Both quantitative
and qualitative results show the powerful long-range context modeling ability
and strong generalization ability of our REFL-Net.
- Abstract(参考訳): 複雑なシーンにおけるセマンティックセグメンテーションは、オブジェクトの外観だけでなく、オブジェクトの位置や周囲環境にも依存する。
それにもかかわらず、大規模ポイントクラウドの計算コストが大きいため、ペアワイズなポイント相関の形式で長距離コンテキストをモデル化することは困難である。
本稿では,細粒度点やボクセルの代わりに,領域を点雲の中間表現として用いて計算負担を軽減することを提案する。
本稿では,領域相関を利用して特徴学習を向上する領域拡張型特徴学習ネットワーク(REFL-Net)を提案する。
セマンティクス空間領域抽出ステージと領域依存モデリングステージからなる、領域ベース機能拡張(rfe)モジュールを設計する。
第1段階では、入力ポイントは、その意味的および空間的近接に基づいて、一連の領域にグループ化される。
第2段階では,地域特徴に対する自己注意ブロックを用いて地域間意味と空間的関係を探索し,地域特徴と融合してより識別的な表現を得る。
提案するrfeモジュールはプラグアンドプレイであり,共通のセグメンテーションバックボーンと統合することができる。
ScanNetV2およびS3DISデータセットに関する広範な実験を行い、異なるセグメンテーションバックボーンでRFEモジュールを評価する。
我々のREFL-Netは、ScanNetV2で1.8% mIoUゲイン、S3DISで1.7% mIoUゲインを達成した。
定量的および定性的な結果から,refl-netの強力な長距離文脈モデリング能力と強汎化能力を示す。
関連論文リスト
- Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - Local region-learning modules for point cloud classification [0.0]
本研究では,各中心点に対する適切なシフトを推定し,各局所領域の半径を変化させる2つの局所学習モジュールを提案する。
どちらのモジュールも独立して、PointNet++とPointCNNオブジェクト分類アーキテクチャに統合しました。
ShapeNetデータセットを用いた実験の結果,モジュールは3次元CADモデルにも有効であることがわかった。
論文 参考訳(メタデータ) (2023-03-30T12:45:46Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - Refine and Represent: Region-to-Object Representation Learning [55.70715883351945]
本稿では、領域ベースとオブジェクト中心の事前学習を統一する領域対オブジェクト表現学習(R2O)を提案する。
R2Oは、エンコーダを訓練して、領域ベースのセグメントをオブジェクト中心のマスクに動的に洗練する。
ImageNetで事前トレーニングを行った後、R2Oモデルは教師なしオブジェクトセグメンテーションにおける既存の最先端技術を上回ることができる。
論文 参考訳(メタデータ) (2022-08-25T01:44:28Z) - PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。
領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。
形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文 参考訳(メタデータ) (2021-12-09T13:24:43Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - LRC-Net: Learning Discriminative Features on Point Clouds by Encoding
Local Region Contexts [65.79931333193016]
本稿では,LRC-Net(Local-Region-Context Network)を提案する。
LRC-Netは、局所領域内および周辺領域間の微粒なコンテキストを同時に符号化する。
その結果, LRC-Netは形状分類や形状分割の応用において最先端の手法と競合することがわかった。
論文 参考訳(メタデータ) (2020-03-18T14:34:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。