Fugu-MT 論文翻訳(概要): Region-Enhanced Feature Learning for Scene Semantic Segmentation

論文の概要: Region-Enhanced Feature Learning for Scene Semantic Segmentation

arxiv url: http://arxiv.org/abs/2304.07486v2
Date: Tue, 18 Apr 2023 01:50:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-19 11:24:12.872846
Title: Region-Enhanced Feature Learning for Scene Semantic Segmentation
Title（参考訳）: シーンセマンティックセグメンテーションのための地域機能学習
Authors: Xin Kang, Chaoqun Wang, Xuejin Chen
Abstract要約: 本稿では,微細な点やボクセルの代わりに,点雲の中間表現として領域を用いることを提案する。本稿では、領域相関を利用して曖昧な点の特徴を高める新しい領域拡張特徴学習ネットワーク(REFL-Net)を提案する。我々のREFL-NetはScanNetv2で1.8% mIoU、S3DISデータセットで1.0% mIoUを得る。
参考スコア（独自算出の注目度）: 26.173914279848095
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic segmentation in complex scenes not only relies on local object appearance but also on object locations and the surrounding environment. Nonetheless, it is difficult to model long-range context in the format of pairwise point correlations due to its huge computational cost for large-scale point clouds. In this paper, we propose to use regions as the intermediate representation of point clouds instead of fine-grained points or voxels to reduce the computational burden. We introduce a novel Region-Enhanced Feature Learning network (REFL-Net) that leverages region correlations to enhance the features of ambiguous points. We design a Region-based Feature Enhancement module (RFE) which consists of a Semantic-Spatial Region Extraction (SSRE) stage and a Region Dependency Modeling (RDM) stage. In the SSRE stage, we group the input points into a set of regions according to the point distances in both semantic and spatial space. In the RDM part, we explore region-wise semantic and spatial relationships via a self-attention block on region features and fuse point features with the region features to obtain more discriminative representations. Our proposed RFE module is a plug-and-play module that can be integrated with common semantic segmentation backbones. We conduct extensive experiments on ScanNetv2 and S3DIS datasets, and evaluate our RFE module with different segmentation backbones. Our REFL-Net achieves 1.8% mIoU gain on ScanNetv2 and 1.0% mIoU gain on S3DIS respectively with negligible computational cost compared to the backbone networks. Both quantitative and qualitative results show the powerful long-range context modeling ability and strong generalization ability of our REFL-Net.
Abstract（参考訳）: 複雑なシーンにおける意味セグメンテーションは、局所的なオブジェクトの外観だけでなく、オブジェクトの位置や周囲の環境にも依存する。それにもかかわらず、大規模ポイントクラウドの計算コストが大きいため、ペアワイズなポイント相関の形式で長距離コンテキストをモデル化することは困難である。本稿では,計算負荷を軽減するために,細粒度点やボクセルではなく,点雲の中間表現として領域を用いることを提案する。本稿では、領域相関を利用して曖昧な点の特徴を高める新しい領域拡張特徴学習ネットワーク(REFL-Net)を提案する。本研究では,意味空間領域抽出 (SSRE) 段階と領域依存モデリング (RDM) 段階からなる領域ベース特徴拡張モジュール (RFE) を設計する。 ssreの段階では、入力点を意味空間と空間空間空間の両方の点距離に応じて一連の領域にグループ化する。 RDMでは,領域の特徴に対する自己注意ブロックと,領域の特徴と融合点特徴を用いて,地域的意味と空間的関係を探索し,より識別的な表現を得る。提案するRFEモジュールは,一般的なセマンティックセグメンテーションバックボーンと統合可能なプラグイン・アンド・プレイモジュールである。 ScanNetv2とS3DISデータセットに関する広範な実験を行い、異なるセグメンテーションバックボーンでRFEモジュールを評価する。我々のREFL-NetはScanNetv2の1.8% mIoUゲインとS3DISの1.0% mIoUゲインを、バックボーンネットワークと比較して無視できる計算コストで達成している。定量的および定性的な結果から,refl-netの強力な長距離文脈モデリング能力と強汎化能力を示す。

関連論文リスト

Region-based Cluster Discrimination for Visual Representation Learning [30.79223671093668]
Region-Aware Cluster Discrimination (RICE)は、地域レベルの視覚とOCR機能を強化する新しい手法である。 RICEは、セグメンテーション、密集検知、視覚知覚など、タスクにおける従来の手法よりも一貫して優れている。
論文参考訳（メタデータ） (2025-07-26T17:47:09Z)
Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文参考訳（メタデータ） (2024-09-21T02:23:01Z)
Local region-learning modules for point cloud classification [0.0]
本研究では,各中心点に対する適切なシフトを推定し,各局所領域の半径を変化させる2つの局所学習モジュールを提案する。どちらのモジュールも独立して、PointNet++とPointCNNオブジェクト分類アーキテクチャに統合しました。 ShapeNetデータセットを用いた実験の結果,モジュールは3次元CADモデルにも有効であることがわかった。
論文参考訳（メタデータ） (2023-03-30T12:45:46Z)
DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (2022-12-16T06:23:58Z)
Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文参考訳（メタデータ） (2022-11-20T07:10:14Z)
LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文参考訳（メタデータ） (2022-10-12T02:11:00Z)
Refine and Represent: Region-to-Object Representation Learning [55.70715883351945]
本稿では、領域ベースとオブジェクト中心の事前学習を統一する領域対オブジェクト表現学習(R2O)を提案する。 R2Oは、エンコーダを訓練して、領域ベースのセグメントをオブジェクト中心のマスクに動的に洗練する。 ImageNetで事前トレーニングを行った後、R2Oモデルは教師なしオブジェクトセグメンテーションにおける既存の最先端技術を上回ることができる。
論文参考訳（メタデータ） (2022-08-25T01:44:28Z)
Multi-scale Network with Attentional Multi-resolution Fusion for Point Cloud Semantic Segmentation [2.964101313270572]
ローカルおよびグローバルなマルチスケール情報を集約する総合的なポイントクラウドセマンティックセマンティックセマンティクスネットワークを提案する。点の局所的な形状を効果的に学習するアングル相関点畳み込みモジュールを提案する。第3に、2Dイメージビジョンタスクのパフォーマンスに優れたHRNetにインスパイアされた私たちは、ポイントクラウド用にカスタマイズされたHRNetを構築し、グローバルなマルチスケールコンテキストを学習します。
論文参考訳（メタデータ） (2022-06-27T21:03:33Z)
PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文参考訳（メタデータ） (2021-12-09T13:24:43Z)
Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文参考訳（メタデータ） (2021-07-28T03:46:57Z)
LRC-Net: Learning Discriminative Features on Point Clouds by Encoding Local Region Contexts [65.79931333193016]
本稿では,LRC-Net(Local-Region-Context Network)を提案する。 LRC-Netは、局所領域内および周辺領域間の微粒なコンテキストを同時に符号化する。その結果, LRC-Netは形状分類や形状分割の応用において最先端の手法と競合することがわかった。
論文参考訳（メタデータ） (2020-03-18T14:34:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。