論文の概要: LGENet: Local and Global Encoder Network for Semantic Segmentation of
Airborne Laser Scanning Point Clouds
- arxiv url: http://arxiv.org/abs/2012.10192v1
- Date: Fri, 18 Dec 2020 12:26:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:11:36.890826
- Title: LGENet: Local and Global Encoder Network for Semantic Segmentation of
Airborne Laser Scanning Point Clouds
- Title(参考訳): LGENet: 航空機搭載レーザー走査点雲のセマンティックセグメンテーションのためのローカルおよびグローバルエンコーダネットワーク
- Authors: Yaping Lin, George Vosselman, Yanpeng Cao, Michael Ying Yang
- Abstract要約: 我々はALS点雲のセマンティックセグメンテーションのためのローカルおよびグローバルエンコーダネットワーク(LGENet)を提案する。
ISPRSベンチマークデータセットでは、このモデルは0.845の全体的な精度と平均0.737のF1スコアで最新の結果を達成します。
- 参考スコア(独自算出の注目度): 17.840158282335874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interpretation of Airborne Laser Scanning (ALS) point clouds is a critical
procedure for producing various geo-information products like 3D city models,
digital terrain models and land use maps. In this paper, we present a local and
global encoder network (LGENet) for semantic segmentation of ALS point clouds.
Adapting the KPConv network, we first extract features by both 2D and 3D point
convolutions to allow the network to learn more representative local geometry.
Then global encoders are used in the network to exploit contextual information
at the object and point level. We design a segment-based Edge Conditioned
Convolution to encode the global context between segments. We apply a
spatial-channel attention module at the end of the network, which not only
captures the global interdependencies between points but also models
interactions between channels. We evaluate our method on two ALS datasets
namely, the ISPRS benchmark dataset and DCF2019 dataset. For the ISPRS
benchmark dataset, our model achieves state-of-the-art results with an overall
accuracy of 0.845 and an average F1 score of 0.737. With regards to the DFC2019
dataset, our proposed network achieves an overall accuracy of 0.984 and an
average F1 score of 0.834.
- Abstract(参考訳): 空中レーザー走査(ALS)点雲の解釈は、3次元都市モデル、デジタル地形モデル、土地利用地図などの様々な地理情報製品を生産するための重要な手順である。
本稿では,ALS点雲のセマンティックセグメンテーションのためのローカルおよびグローバルエンコーダネットワーク(LGENet)を提案する。
KPConvネットワークに適応して,まず2次元と3次元の点畳み込みによって特徴を抽出し,ネットワークがより代表的な局所幾何学を学習できるようにする。
次に、ネットワーク内でグローバルエンコーダを使用して、オブジェクトとポイントレベルのコンテキスト情報を利用する。
セグメント間のグローバルコンテキストを符号化するセグメントベースのエッジ条件付き畳み込みを設計する。
ネットワークの最後に空間チャネルアテンションモジュールを適用することで,ポイント間のグローバルな相互依存を捉えるだけでなく,チャネル間のインタラクションをモデル化する。
提案手法をISPRSベンチマークデータセットとDCF2019データセットの2つのALSデータセット上で評価する。
ISPRSベンチマークデータセットでは, 平均F1スコアが0.737, 0.845, 平均F1スコアが0.737である。
DFC2019データセットに関して、提案するネットワークは、0.984の総合精度と平均F1スコアの0.834を達成する。
関連論文リスト
- Low-Resource White-Box Semantic Segmentation of Supporting Towers on 3D
Point Clouds via Signature Shape Identification [52.77024349608834]
SCENE-Netは3Dポイントクラウドセマンティックセグメンテーションのための低リソースのホワイトボックスモデルである。
ラップトップでのトレーニング時間は85分、推論時間は20ミリ秒です。
40000 Kmというラベル付きラベル付きデータセットを、農村の地形点雲とコード実装のデータセットとしてリリースしています。
論文 参考訳(メタデータ) (2023-06-13T14:36:06Z) - Dynamic Clustering Transformer Network for Point Cloud Segmentation [23.149220817575195]
動的クラスタリングトランスネットワーク(DCTNet)と呼ばれる新しい3Dポイントクラウド表現ネットワークを提案する。
エンコーダ-デコーダアーキテクチャがあり、ローカルとグローバルの両方の機能学習が可能である。
提案手法は,オブジェクトベースデータセット(ShapeNet),都市ナビゲーションデータセット(Toronto-3D),マルチスペクトルLiDARデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-05-30T01:11:05Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - Global Hierarchical Attention for 3D Point Cloud Analysis [88.56041763189162]
我々は,GHA(Global Hierarchical Attention)と呼ばれる3Dポイントクラウド解析のための新しい注意機構を提案する。
セマンティックセグメンテーションのタスクでは、GHAはScanNet上のMinkowskiEngineベースラインに+1.7%のmIoU増加を与える。
3Dオブジェクト検出タスクでは、GHAはnuScenesデータセット上でCenterPointベースラインを+0.5%mAP改善する。
論文 参考訳(メタデータ) (2022-08-07T19:16:30Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Neural RF SLAM for unsupervised positioning and mapping with channel
state information [51.484516640867525]
アイソメトリによるユーザ位置と環境マッピングを共同で学習するニューラルネットワークアーキテクチャを提案する。
提案モデルでは,物理ベースのデコーダを適用すれば,解釈可能な潜在能力,すなわちユーザ位置を学習できる。
論文 参考訳(メタデータ) (2022-03-15T21:32:44Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。
領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。
形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文 参考訳(メタデータ) (2021-12-09T13:24:43Z) - An Attention-Fused Network for Semantic Segmentation of
Very-High-Resolution Remote Sensing Imagery [26.362854938949923]
注目融合ネットワーク(AFNet)という,新しい畳み込みニューラルネットワークアーキテクチャを提案する。
ISPRS Vaihingen 2DデータセットとISPRS Potsdam 2Dデータセットで、総精度91.7%、平均F1スコア90.96%の最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-05-10T06:23:27Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - Interactive Video Object Segmentation Using Global and Local Transfer
Modules [51.93009196085043]
我々はアノテーションネットワーク(A-Net)と転送ネットワーク(T-Net)からなるディープニューラルネットワークを開発する。
A-Netは、フレーム上のユーザ記述を前提として、エンコーダ-デコーダアーキテクチャに基づいたセグメンテーション結果を生成する。
ユーザスクリブルをエミュレートし,補助的な損失を生かして,ネットワーク全体を2段階に分けてトレーニングする。
論文 参考訳(メタデータ) (2020-07-16T06:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。