論文の概要: Semi-Local Convolutions for LiDAR Scan Processing
- arxiv url: http://arxiv.org/abs/2111.15615v1
- Date: Tue, 30 Nov 2021 18:09:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 14:21:08.756585
- Title: Semi-Local Convolutions for LiDAR Scan Processing
- Title(参考訳): LiDARスキャン処理のための半局所畳み込み
- Authors: Larissa T. Triess, David Peter, J. Marius Z\"ollner
- Abstract要約: 移動ロボットや自動走行車などの多くのアプリケーションは、LiDARセンサーを使用して周囲の詳細な情報を取得する。
多くの方法は画像のようなプロジェクションを使ってこれらのLiDAR測定を効率的に処理し、深層畳み込みニューラルネットワークを使ってスキャンの各点のセマンティッククラスを予測する。
本研究では,垂直方向の重量共有量を低減した半局所畳み込み層(SLC)を提案する。
- 参考スコア(独自算出の注目度): 0.42970700836450487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A number of applications, such as mobile robots or automated vehicles, use
LiDAR sensors to obtain detailed information about their three-dimensional
surroundings. Many methods use image-like projections to efficiently process
these LiDAR measurements and use deep convolutional neural networks to predict
semantic classes for each point in the scan. The spatial stationary assumption
enables the usage of convolutions. However, LiDAR scans exhibit large
differences in appearance over the vertical axis. Therefore, we propose semi
local convolution (SLC), a convolution layer with reduced amount of
weight-sharing along the vertical dimension. We are first to investigate the
usage of such a layer independent of any other model changes. Our experiments
did not show any improvement over traditional convolution layers in terms of
segmentation IoU or accuracy.
- Abstract(参考訳): 移動ロボットや自動走行車などの多くのアプリケーションは、LiDARセンサーを使用して、彼らの3次元環境に関する詳細な情報を取得する。
多くの方法は画像のようなプロジェクションを使ってこれらのLiDAR測定を効率的に処理し、深層畳み込みニューラルネットワークを使ってスキャンの各点のセマンティッククラスを予測する。
空間定常仮定は畳み込みの使用を可能にする。
しかし、LiDARスキャンでは垂直軸の外観に大きな違いが見られる。
そこで本研究では,垂直方向の重量共有量を低減した半局所畳み込み層(SLC)を提案する。
私たちはまず、他のモデル変更とは無関係に、そのようなレイヤの使用を調査します。
セグメンテーションIoUや精度の観点からは,従来の畳み込み層よりも改善は見られなかった。
関連論文リスト
- LiOn-XA: Unsupervised Domain Adaptation via LiDAR-Only Cross-Modal Adversarial Training [61.26381389532653]
LiOn-XAは、LiDAR-Only Cross-Modal (X)学習と3D LiDARポイントクラウドセマンティックセマンティックセグメンテーションのためのAdversarial Trainingを組み合わせた、教師なしドメイン適応(UDA)アプローチである。
3つの現実的適応シナリオに関する実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-10-21T09:50:17Z) - FocDepthFormer: Transformer with latent LSTM for Depth Estimation from Focal Stack [11.433602615992516]
本稿では,トランスフォーマーをLSTMモジュールとCNNデコーダと統合した新しいトランスフォーマーネットワークFocDepthFormerを提案する。
LSTMを組み込むことで、FocDepthFormerは大規模な単分子RGB深さ推定データセットで事前トレーニングすることができる。
我々のモデルは、複数の評価指標で最先端のアプローチより優れています。
論文 参考訳(メタデータ) (2023-10-17T11:53:32Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Scale-Equivariant Deep Learning for 3D Data [44.52688267348063]
畳み込みニューラルネットワーク(CNN)は、画像の位置に関係なく物体を認識する。
本稿では,3次元データに対するスケール・等価な畳み込みネットワーク層を提案する。
本実験は,3次元医用画像解析の尺度等式化における提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-04-12T13:56:12Z) - SeqOT: A Spatial-Temporal Transformer Network for Place Recognition
Using Sequential LiDAR Data [9.32516766412743]
本研究では,シーケンシャルレンジ画像から得られる時間的・空間的情報を活用するトランスフォーマーネットワークSeqOTを提案する。
異なる環境下で異なる種類のLiDARセンサを用いて収集した4つのデータセットに対するアプローチを評価した。
本手法は,センサのフレームレートよりも高速に動作する。
論文 参考訳(メタデータ) (2022-09-16T14:08:11Z) - LiDAR Distillation: Bridging the Beam-Induced Domain Gap for 3D Object
Detection [96.63947479020631]
多くの現実世界の応用において、大量生産されたロボットや車両が使用するLiDARポイントは通常、大規模な公開データセットよりもビームが少ない。
異なるLiDARビームによって誘導される領域ギャップをブリッジして3次元物体検出を行うLiDAR蒸留法を提案する。
論文 参考訳(メタデータ) (2022-03-28T17:59:02Z) - Adaptive Machine Learning for Time-Varying Systems: Low Dimensional
Latent Space Tuning [91.3755431537592]
本稿では,時間変化システムを対象とした適応機械学習手法を提案する。
我々は,エンコーダデコーダCNNのエンコーダ部出力において,非常に高次元(N>100k)の入力を低次元(N2)潜在空間にマッピングする。
そこで本手法では,割り込みを伴わないフィードバックに基づいて,内部の相関関係を学習し,その進化をリアルタイムで追跡する。
論文 参考訳(メタデータ) (2021-07-13T16:05:28Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z) - LodoNet: A Deep Neural Network with 2D Keypoint Matchingfor 3D LiDAR
Odometry Estimation [22.664095688406412]
本稿では,LiDARフレームを画像空間に転送し,画像特徴抽出として問題を再構成することを提案する。
特徴抽出のためのスケール不変特徴変換(SIFT)の助けを借りて、マッチングキーポイントペア(MKP)を生成することができる。
畳み込みニューラルネットワークパイプラインは、抽出したMKPによるLiDARのオドメトリー推定のために設計されている。
提案手法,すなわちLodoNet は,KITTI odometry 推定ベンチマークで評価され,最先端の手法と同等あるいはそれ以上の結果が得られた。
論文 参考訳(メタデータ) (2020-09-01T01:09:41Z) - Scan-based Semantic Segmentation of LiDAR Point Clouds: An Experimental
Study [2.6205925938720833]
最先端の手法では、深いニューラルネットワークを使用して、LiDARスキャンの各点のセマンティッククラスを予測する。
LiDAR測定を処理するための強力で効率的な方法は、2次元の画像のような投影を使うことである。
メモリの制約だけでなく、パフォーマンスの向上やランタイムの改善など、さまざまなテクニックを実証する。
論文 参考訳(メタデータ) (2020-04-06T11:08:12Z) - SqueezeSegV3: Spatially-Adaptive Convolution for Efficient Point-Cloud
Segmentation [66.49351944322835]
大規模なポイントクラウドセグメンテーションでは、textitde factoメソッドは3Dポイントクラウドを投影して2D LiDARイメージを取得し、畳み込みを使用して処理する。
入力画像に応じて異なる位置の異なるフィルタを採用するための空間適応畳み込み(SAC)を提案する。
SACは、要素ワイド乗算、im2col、標準畳み込みのシリーズとして実装できるため、効率的に計算できる。
論文 参考訳(メタデータ) (2020-04-03T22:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。