論文の概要: Multi-scale Network with Attentional Multi-resolution Fusion for Point
Cloud Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2206.13628v1
- Date: Mon, 27 Jun 2022 21:03:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-02 19:06:07.670062
- Title: Multi-scale Network with Attentional Multi-resolution Fusion for Point
Cloud Semantic Segmentation
- Title(参考訳): ポイントクラウドセマンティクスセグメンテーションのための注意深いマルチレゾリューション融合を用いたマルチスケールネットワーク
- Authors: Yuyan Li, Ye Duan
- Abstract要約: ローカルおよびグローバルなマルチスケール情報を集約する総合的なポイントクラウドセマンティックセマンティックセマンティクスネットワークを提案する。
点の局所的な形状を効果的に学習するアングル相関点畳み込みモジュールを提案する。
第3に、2Dイメージビジョンタスクのパフォーマンスに優れたHRNetにインスパイアされた私たちは、ポイントクラウド用にカスタマイズされたHRNetを構築し、グローバルなマルチスケールコンテキストを学習します。
- 参考スコア(独自算出の注目度): 2.964101313270572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a comprehensive point cloud semantic segmentation
network that aggregates both local and global multi-scale information. First,
we propose an Angle Correlation Point Convolution (ACPConv) module to
effectively learn the local shapes of points. Second, based upon ACPConv, we
introduce a local multi-scale split (MSS) block that hierarchically connects
features within one single block and gradually enlarges the receptive field
which is beneficial for exploiting the local context. Third, inspired by HRNet
which has excellent performance on 2D image vision tasks, we build an HRNet
customized for point cloud to learn global multi-scale context. Lastly, we
introduce a point-wise attention fusion approach that fuses multi-resolution
predictions and further improves point cloud semantic segmentation performance.
Our experimental results and ablations on several benchmark datasets show that
our proposed method is effective and able to achieve state-of-the-art
performances compared to existing methods.
- Abstract(参考訳): 本稿では,ローカルとグローバルの両方のマルチスケール情報を集約する包括的ポイントクラウドセマンティクスセグメンテーションネットワークを提案する。
まず,点の局所的な形状を効果的に学習するアングル相関点変換 (ACPConv) モジュールを提案する。
次に, ACPConvに基づいて, 局所的マルチスケールスプリット(MSS)ブロックを導入し, 単一ブロック内の特徴を階層的に結合し, 局所的コンテキストを活用できる受容領域を徐々に拡大する。
第3に、2Dイメージビジョンタスクのパフォーマンスに優れたHRNetにインスパイアされた私たちは、ポイントクラウド用にカスタマイズされたHRNetを構築し、グローバルなマルチスケールコンテキストを学習します。
最後に,マルチレゾリューション予測を融合し,ポイントクラウドのセマンティクスセグメンテーション性能をさらに向上させるポイントワイズアテンション融合手法を提案する。
実験結果といくつかのベンチマークデータセットの短縮により,提案手法は既存手法と比較して有効であり,最先端性能を達成可能であることが示された。
関連論文リスト
- Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Global Attention-Guided Dual-Domain Point Cloud Feature Learning for Classification and Segmentation [21.421806351869552]
上記の問題に対処するために,グローバルアテンション誘導型デュアルドメイン特徴学習ネットワーク(GAD)を提案する。
我々はまず,改良されたグローバルアテンション機構を備えたコンテキスト位置強調変換器(CPT)モジュールを考案した。
次に、デュアルドメインK-アレスト隣のフィーチャーフュージョン(DKFF)をカスケードして、効果的なフィーチャーアグリゲーションを行う。
論文 参考訳(メタデータ) (2024-07-12T05:19:19Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - GFNet: Geometric Flow Network for 3D Point Cloud Semantic Segmentation [91.15865862160088]
本稿では,異なるビュー間の幾何対応性を検討するための幾何フローネットワーク (GFNet) を提案する。
具体的には、異なる視点にまたがって補完情報を双方向に整列し、伝播する新しい幾何フローモジュール(GFM)を考案する。
論文 参考訳(メタデータ) (2022-07-06T11:48:08Z) - PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。
領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。
形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文 参考訳(メタデータ) (2021-12-09T13:24:43Z) - Background-Aware 3D Point Cloud Segmentationwith Dynamic Point Feature
Aggregation [12.093182949686781]
DPFA-Net(Dynamic Point Feature Aggregation Network)と呼ばれる新しい3Dポイント・クラウド・ラーニング・ネットワークを提案する。
DPFA-Netにはセマンティックセグメンテーションと3Dポイントクラウドの分類のための2つのバリエーションがある。
S3DISデータセットのセマンティックセグメンテーションのための、最先端の全体的な精度スコアを達成する。
論文 参考訳(メタデータ) (2021-11-14T05:46:05Z) - Encoder Fusion Network with Co-Attention Embedding for Referring Image
Segmentation [87.01669173673288]
本稿では,視覚的エンコーダをマルチモーダルな特徴学習ネットワークに変換するエンコーダ融合ネットワーク(EFN)を提案する。
EFNには、マルチモーダル機能の並列更新を実現するコアテンションメカニズムが組み込まれている。
4つのベンチマークデータセットによる実験結果から,提案手法がポストプロセッシングを伴わずに最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-05-05T02:27:25Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。