論文の概要: SqueezeSegV3: Spatially-Adaptive Convolution for Efficient Point-Cloud
Segmentation
- arxiv url: http://arxiv.org/abs/2004.01803v2
- Date: Tue, 13 Apr 2021 09:42:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 04:57:00.887759
- Title: SqueezeSegV3: Spatially-Adaptive Convolution for Efficient Point-Cloud
Segmentation
- Title(参考訳): squeezesegv3: 効率的なポイントクラウドセグメンテーションのための空間適応畳み込み
- Authors: Chenfeng Xu, Bichen Wu, Zining Wang, Wei Zhan, Peter Vajda, Kurt
Keutzer, Masayoshi Tomizuka
- Abstract要約: 大規模なポイントクラウドセグメンテーションでは、textitde factoメソッドは3Dポイントクラウドを投影して2D LiDARイメージを取得し、畳み込みを使用して処理する。
入力画像に応じて異なる位置の異なるフィルタを採用するための空間適応畳み込み(SAC)を提案する。
SACは、要素ワイド乗算、im2col、標準畳み込みのシリーズとして実装できるため、効率的に計算できる。
- 参考スコア(独自算出の注目度): 66.49351944322835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR point-cloud segmentation is an important problem for many applications.
For large-scale point cloud segmentation, the \textit{de facto} method is to
project a 3D point cloud to get a 2D LiDAR image and use convolutions to
process it. Despite the similarity between regular RGB and LiDAR images, we
discover that the feature distribution of LiDAR images changes drastically at
different image locations. Using standard convolutions to process such LiDAR
images is problematic, as convolution filters pick up local features that are
only active in specific regions in the image. As a result, the capacity of the
network is under-utilized and the segmentation performance decreases. To fix
this, we propose Spatially-Adaptive Convolution (SAC) to adopt different
filters for different locations according to the input image. SAC can be
computed efficiently since it can be implemented as a series of element-wise
multiplications, im2col, and standard convolution. It is a general framework
such that several previous methods can be seen as special cases of SAC. Using
SAC, we build SqueezeSegV3 for LiDAR point-cloud segmentation and outperform
all previous published methods by at least 3.7% mIoU on the SemanticKITTI
benchmark with comparable inference speed.
- Abstract(参考訳): LiDARポイントクラウドセグメンテーションは多くのアプリケーションにとって重要な問題である。
大規模ポイントクラウドセグメンテーションでは、textit{de facto}メソッドは、3Dポイントクラウドを投影して2D LiDARイメージを取得し、畳み込みを使用して処理する。
通常のRGB画像とLiDAR画像の類似性にもかかわらず,LiDAR画像の特徴分布が画像位置によって大きく変化することがわかった。
コンボリューションフィルタは、画像内の特定の領域でのみアクティブなローカル特徴を拾うため、そのようなLiDARイメージの処理に標準の畳み込みを使用するのが問題となる。
その結果、ネットワークの容量が未利用となり、セグメンテーション性能が低下する。
これを解決するために、入力画像に応じて異なる位置の異なるフィルタを採用するための空間適応畳み込み(SAC)を提案する。
SACは、要素ワイド乗算、im2col、標準畳み込みのシリーズとして実装できるため、効率的に計算できる。
従来のいくつかの方法がsacの特別な場合と見なされるような一般的な枠組みである。
SACを用いて、LiDARのポイントクラウドセグメンテーションのためのSqueezeSegV3を構築し、SemanticKITTIベンチマークで少なくとも3.7%のmIoUで、同等の推論速度で、過去のすべてのメソッドを上回ります。
関連論文リスト
- Spherical Frustum Sparse Convolution Network for LiDAR Point Cloud Semantic Segmentation [62.258256483231484]
LiDARポイントクラウドセマンティックセグメンテーションにより、ロボットは周囲の環境のきめ細かいセマンティック情報を得ることができる。
多くの研究が2Dイメージ上にポイントクラウドを投影し、LiDARポイントクラウドセマンティックセグメンテーションのための2D畳み込みニューラルネットワーク(CNN)またはビジョントランスフォーマーを採用する。
本稿では,情報損失の定量化を回避するために,新しい球状フラストラム構造を提案する。
論文 参考訳(メタデータ) (2023-11-29T09:55:13Z) - LiDAR-Camera Panoptic Segmentation via Geometry-Consistent and
Semantic-Aware Alignment [63.83894701779067]
我々は,最初のLiDAR-Camera Panoptic NetworkであるLCPSを提案する。
提案手法では,LiDAR-Camera融合を3段階に分けて行う。
我々の融合戦略は、NuScenesデータセット上のLiDARのみのベースラインに対して、約6.9%のPQ性能を改善する。
論文 参考訳(メタデータ) (2023-08-03T10:57:58Z) - Quadric Representations for LiDAR Odometry, Mapping and Localization [93.24140840537912]
現在のLiDARオードメトリ、マッピング、ローカライズ手法は、3Dシーンのポイントワイズ表現を利用する。
3次元オブジェクトのよりコンパクトな表現である2次元曲面を用いたシーン記述法を提案する。
提案手法は低レイテンシとメモリの有効性を維持しつつ、競争力があり、しかも精度も優れている。
論文 参考訳(メタデータ) (2023-04-27T13:52:01Z) - (LC)$^2$: LiDAR-Camera Loop Constraints For Cross-Modal Place
Recognition [0.9449650062296824]
本稿では,先行点クラウドマップを使わずにLiDARローカライゼーションを実現するために, (LC)$2$と呼ばれる新しいクロスマッチング手法を提案する。
ネットワークは、異なる画像とレンジ画像からローカライズ記述子を抽出するために訓練される。
我々は、LiDARベースのナビゲーションシステムが画像データベースから最適化され、その逆も可能であることを実証する。
論文 参考訳(メタデータ) (2023-04-17T23:20:16Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - Meta-RangeSeg: LiDAR Sequence Semantic Segmentation Using Multiple
Feature Aggregation [21.337629798133324]
メタランジセグと呼ばれるLiDAR配列のセマンティックセグメンテーションに対する新しいアプローチを提案する。
空間時間情報をキャプチャするために、新しい範囲残像表現を導入する。
マルチスケール機能を得るために、効率的なU-Netバックボーンが使用される。
論文 参考訳(メタデータ) (2022-02-27T14:46:13Z) - Semi-Local Convolutions for LiDAR Scan Processing [0.42970700836450487]
移動ロボットや自動走行車などの多くのアプリケーションは、LiDARセンサーを使用して周囲の詳細な情報を取得する。
多くの方法は画像のようなプロジェクションを使ってこれらのLiDAR測定を効率的に処理し、深層畳み込みニューラルネットワークを使ってスキャンの各点のセマンティッククラスを予測する。
本研究では,垂直方向の重量共有量を低減した半局所畳み込み層(SLC)を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:09:43Z) - Adaptive Graph Convolution for Point Cloud Analysis [25.175406613705274]
本稿では,動的に学習した特徴に応じて適応的なカーネルを生成する適応グラフ畳み込み(Adaptive Graph Convolution, AdaptConv)を提案する。
提案手法は,いくつかのベンチマークデータセットにおいて,最先端のクラウド分類とセグメンテーションアプローチより優れている。
論文 参考訳(メタデータ) (2021-08-18T08:38:52Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。