論文の概要: Spatial Layout Consistency for 3D Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2303.00939v1
- Date: Thu, 2 Mar 2023 03:24:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 16:08:44.106852
- Title: Spatial Layout Consistency for 3D Semantic Segmentation
- Title(参考訳): 3次元意味セグメンテーションのための空間レイアウト一貫性
- Authors: Maryam Jameela, Gunho Sohn
- Abstract要約: 本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 0.7614628596146599
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the aged nature of much of the utility network infrastructure,
developing a robust and trustworthy computer vision system capable of
inspecting it with minimal human intervention has attracted considerable
research attention. The airborne laser terrain mapping (ALTM) system quickly
becomes the central data collection system among the numerous available
sensors. Its ability to penetrate foliage with high-powered energy provides
wide coverage and achieves survey-grade ranging accuracy. However, the
post-data acquisition process for classifying the ALTM's dense and irregular
point clouds is a critical bottleneck that must be addressed to improve
efficiency and accuracy. We introduce a novel deep convolutional neural network
(DCNN) technique for achieving voxel-based semantic segmentation of the ALTM's
point clouds. The suggested deep learning method, Semantic Utility Network
(SUNet) is a multi-dimensional and multi-resolution network. SUNet combines two
networks: one classifies point clouds at multi-resolution with object
categories in three dimensions and another predicts two-dimensional regional
labels distinguishing corridor regions from non-corridors. A significant
innovation of the SUNet is that it imposes spatial layout consistency on the
outcomes of voxel-based and regional segmentation results. The proposed
multi-dimensional DCNN combines hierarchical context for spatial layout
embedding with a coarse-to-fine strategy. We conducted a comprehensive ablation
study to test SUNet's performance using 67 km x 67 km of utility corridor data
at a density of 5pp/m2. Our experiments demonstrated that SUNet's spatial
layout consistency and a multi-resolution feature aggregation could
significantly improve performance, outperforming the SOTA baseline network and
achieving a good F1 score for pylon 89%, ground 99%, vegetation 99% and
powerline 98% classes.
- Abstract(参考訳): 多くのユーティリティネットワークインフラの老朽化により、最小限の人的介入でそれを検査できる堅牢で信頼性の高いコンピュータビジョンシステムの開発が研究の注目を集めている。
空中レーザー地形マッピング (altm) システムは、多くのセンサーのうちの中心的なデータ収集システムとなる。
高出力エネルギーで葉を貫く能力は広い範囲をカバーし、調査グレードの精度を達成する。
しかし、ALTMの高密度で不規則な点雲を分類するためのデータ取得プロセスは、効率と精度を向上させるために対処する必要がある重要なボトルネックである。
本稿では,ALTMの点雲のボクセルに基づくセマンティックセグメンテーションを実現するための新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティックユーティリティネットワーク(SUNet)は多次元・多次元ネットワークである。
sunetは2つのネットワークを結合する: 1つはマルチ解像度で点雲と3次元のオブジェクトカテゴリを分類し、もう1つは2次元の領域ラベルを非コリドールと区別する。
SUNetの重要な革新は、ボクセルベースおよび地域セグメンテーションの結果に空間的レイアウトの整合性を課すことである。
提案する多次元DCNNは,空間配置埋め込みのための階層的コンテキストと粗大な戦略を組み合わせる。
67 km x 67 km の実用廊下データを用いて5pp/m2の密度でSuNetの性能試験を行った。
実験の結果,SuNetの空間配置の整合性と多分解能特性の集約は,SOTAベースラインネットワークよりも優れた性能を示し,パイロン89%,グラウンド99%,植生99%,電力線98%に対して良好なF1スコアを得ることができた。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文 参考訳(メタデータ) (2023-12-18T18:16:30Z) - DANet: Density Adaptive Convolutional Network with Interactive Attention
for 3D Point Clouds [30.54110361164338]
ローカル機能とコンテキスト依存は、3Dポイントクラウド分析に不可欠である。
DAConvという密度適応型畳み込みを提案する。
IAMは、異なる空間方向に沿ってチャネルアテンションに空間情報を埋め込む。
論文 参考訳(メタデータ) (2023-03-08T09:46:31Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - An Attention-Fused Network for Semantic Segmentation of
Very-High-Resolution Remote Sensing Imagery [26.362854938949923]
注目融合ネットワーク(AFNet)という,新しい畳み込みニューラルネットワークアーキテクチャを提案する。
ISPRS Vaihingen 2DデータセットとISPRS Potsdam 2Dデータセットで、総精度91.7%、平均F1スコア90.96%の最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-05-10T06:23:27Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - DiffusionNet: Discretization Agnostic Learning on Surfaces [48.658589779470454]
本研究では,空間コミュニケーションにおいて単純な拡散層が極めて有効であるという知見に基づいて,三次元表面の深層学習に新たなアプローチを導入する。
結果として得られるネットワークは、表面の様々なサンプリングと解像度を自動的に一般化する。
主に三角形メッシュ表面に注目し, 表面分類, セグメンテーション, 非剛性対応など, 様々なタスクの最先端結果を示す。
論文 参考訳(メタデータ) (2020-12-01T23:24:22Z) - MNEW: Multi-domain Neighborhood Embedding and Weighting for Sparse Point
Clouds Segmentation [1.2380933178502298]
マルチドメインの近傍埋め込みや,その幾何学的距離,特徴的類似度,周辺空間の疎度に基づく注意重み付けなどを含むMNEWを提案する。
MNEWは、LiDARベースの自動運転認識の適用において重要であるスパースポイントクラウドの最高性能を達成する。
論文 参考訳(メタデータ) (2020-04-05T18:02:07Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。