論文の概要: CGS-Net: Aggregating Colour, Geometry and Semantic Features for
Large-Scale Indoor Place Recognition
- arxiv url: http://arxiv.org/abs/2202.02070v1
- Date: Fri, 4 Feb 2022 10:51:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-07 15:04:31.427710
- Title: CGS-Net: Aggregating Colour, Geometry and Semantic Features for
Large-Scale Indoor Place Recognition
- Title(参考訳): CGS-Net:大規模屋内位置認識のための色・幾何学・意味的特徴の集約
- Authors: Yuhang Ming, Xingrui Yang, Guofeng Zhang, Andrew Calway
- Abstract要約: 大規模屋内位置認識へのアプローチとして,低レベルな色と幾何学的特徴を高レベルなセマンティック特徴で集約する手法を提案する。
我々は、RGBポイントクラウドを取り込み、ローカル機能を5つの3次元カーネルポイント畳み込み層で抽出するディープラーニングネットワークを使用している。
具体的には、セマンティックセグメンテーションタスク上でKPConv層をトレーニングし、抽出したローカル機能がセマンティックに意味があることを保証する。
- 参考スコア(独自算出の注目度): 6.156387608994791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe an approach to large-scale indoor place recognition that
aggregates low-level colour and geometric features with high-level semantic
features. We use a deep learning network that takes in RGB point clouds and
extracts local features with five 3-D kernel point convolutional (KPConv)
layers. We specifically train the KPConv layers on the semantic segmentation
task to ensure that the extracted local features are semantically meaningful.
Then, feature maps from all the five KPConv layers are concatenated together
and fed into the NetVLAD layer to generate the global descriptors. The approach
is trained and evaluated using a large-scale indoor place recognition dataset
derived from the ScanNet dataset, with a test set comprising 3,608 point clouds
generated from 100 different rooms. Comparison with a traditional feature based
method and three state-of-the-art deep learning methods demonstrate that the
approach significantly outperforms all four methods, achieving, for example, a
top-3 average recall rate of 75% compared with 41% for the closest rival
method.
- Abstract(参考訳): 低レベルな色彩と幾何学的特徴を高レベルな意味的特徴で集約した,大規模屋内位置認識へのアプローチについて述べる。
rgbポイントクラウドを取り込んで,5つの3次元kernel point convolutional(kpconv)層でローカルな特徴を抽出する,ディープラーニングネットワークを使用する。
具体的には、セマンティックセグメンテーションタスク上でKPConv層をトレーニングし、抽出したローカル機能がセマンティックに意味があることを保証する。
次に、5つのKPConvレイヤのフィーチャーマップを連結してNetVLADレイヤに入力し、グローバルなディスクリプタを生成する。
このアプローチは、100の異なる部屋から生成される3,608個の点雲からなるテストセットを用いて、scannetデータセットから派生した大規模屋内場所認識データセットを用いて、トレーニングおよび評価を行う。
従来の特徴量に基づく手法と最先端の3つのディープラーニング手法と比較すると、このアプローチは4つの手法すべてを大きく上回っており、例えばトップ3の平均リコール率は75%であり、最も近い手法では41%である。
関連論文リスト
- Continual Learning in 3D Point Clouds: Employing Spectral Techniques for Exemplar Selection [0.40964539027092906]
3次元オブジェクト分類(CL3D)における連続学習のための新しいフレームワークを提案する。
提案手法は,スペクトルクラスタリングを用いた各クラスからのプロトタイプの選択に基づく。
我々は,ModelNet40,ShapeNet,ScanNetのデータセット上で実験を行い,入力空間の特徴を用いることで,最先端の精度を実現する。
論文 参考訳(メタデータ) (2024-09-12T20:34:34Z) - AEGIS-Net: Attention-guided Multi-Level Feature Aggregation for Indoor
Place Recognition [12.728087388529028]
AEGIS-Netは、RGBの点雲を取り込み、グローバルな位置記述子を生成する新しい屋内位置認識モデルである。
AEGIS-Netはセマンティックエンコーダ、セマンティックデコーダ、アテンション誘導機能埋め込みで構成されています。
我々は,ScanNetPRデータセット上でAIGIS-Netを評価し,その性能を事前学習機能ベース手法と5つの最先端ディープラーニングベース手法と比較した。
論文 参考訳(メタデータ) (2023-12-15T05:09:08Z) - Dynamic Clustering Transformer Network for Point Cloud Segmentation [23.149220817575195]
動的クラスタリングトランスネットワーク(DCTNet)と呼ばれる新しい3Dポイントクラウド表現ネットワークを提案する。
エンコーダ-デコーダアーキテクチャがあり、ローカルとグローバルの両方の機能学習が可能である。
提案手法は,オブジェクトベースデータセット(ShapeNet),都市ナビゲーションデータセット(Toronto-3D),マルチスペクトルLiDARデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-05-30T01:11:05Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Two Heads are Better than One: Geometric-Latent Attention for Point
Cloud Classification and Segmentation [10.2254921311882]
本稿では,幾何学的特徴と潜在的特徴を組み合わせて3次元シーンを意味のある部分集合に分割する,革新的な2頭部アテンション層を提案する。
各ヘッドは、幾何学的特徴または潜在的特徴のいずれかを用いて、局所的およびグローバルな情報を組み合わせて、この情報を使用して、より良い局所的関係を学習する。
論文 参考訳(メタデータ) (2021-10-30T11:20:56Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical
Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。
データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。
本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文 参考訳(メタデータ) (2020-08-11T19:10:32Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。