論文の概要: DSLO: Deep Sequence LiDAR Odometry Based on Inconsistent Spatio-temporal Propagation
- arxiv url: http://arxiv.org/abs/2409.00744v1
- Date: Sun, 1 Sep 2024 15:12:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 11:36:58.080503
- Title: DSLO: Deep Sequence LiDAR Odometry Based on Inconsistent Spatio-temporal Propagation
- Title(参考訳): DSLO:不整合時空間伝播に基づく深部配列LiDARオドメトリー
- Authors: Huixin Zhang, Guangming Wang, Xinrui Wu, Chenfeng Xu, Mingyu Ding, Masayoshi Tomizuka, Wei Zhan, Hesheng Wang,
- Abstract要約: 本稿では,LiDAR odometry DSLO の非一貫性時間伝搬に基づく3次元点列学習モデルを提案する。
ピラミッド構造で、シーケンシャルなポーズモジュール、階層的なポーズリファインメントモジュール、時間的特徴伝搬モジュールで構成されている。
- 参考スコア(独自算出の注目度): 66.8732965660931
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces a 3D point cloud sequence learning model based on inconsistent spatio-temporal propagation for LiDAR odometry, termed DSLO. It consists of a pyramid structure with a spatial information reuse strategy, a sequential pose initialization module, a gated hierarchical pose refinement module, and a temporal feature propagation module. First, spatial features are encoded using a point feature pyramid, with features reused in successive pose estimations to reduce computational overhead. Second, a sequential pose initialization method is introduced, leveraging the high-frequency sampling characteristic of LiDAR to initialize the LiDAR pose. Then, a gated hierarchical pose refinement mechanism refines poses from coarse to fine by selectively retaining or discarding motion information from different layers based on gate estimations. Finally, temporal feature propagation is proposed to incorporate the historical motion information from point cloud sequences, and address the spatial inconsistency issue when transmitting motion information embedded in point clouds between frames. Experimental results on the KITTI odometry dataset and Argoverse dataset demonstrate that DSLO outperforms state-of-the-art methods, achieving at least a 15.67\% improvement on RTE and a 12.64\% improvement on RRE, while also achieving a 34.69\% reduction in runtime compared to baseline methods. Our implementation will be available at https://github.com/IRMVLab/DSLO.
- Abstract(参考訳): 本稿では,LDARオドメトリーにおける不整合時空間伝搬に基づく3次元点列学習モデルについて紹介する。
それは、空間情報再利用戦略を備えたピラミッド構造、シーケンシャルポーズ初期化モジュール、ゲート階層ポーズ精製モジュール、時間的特徴伝搬モジュールからなる。
まず、空間的特徴を点特徴ピラミッドを用いて符号化し、連続的なポーズ推定で再利用して計算オーバーヘッドを低減する。
次に、LiDARの高周波サンプリング特性を利用して、LiDARのポーズを初期化するシーケンシャルポーズ初期化手法を提案する。
そして、ゲート推定に基づいて異なる層からの動作情報を選択的に保持又は破棄することにより、ゲート階層のポーズ精細化機構により粗いポーズから細かなポーズを調整する。
最後に、時間的特徴伝搬法を提案し、点雲列からの歴史的動き情報を組み込んで、フレーム間に点雲に埋め込まれた動き情報を伝達する際の空間的不整合問題に対処する。
KITTIオドメトリデータセットとArgoverseデータセットの実験結果によると、DSLOは最先端の手法よりも優れており、少なくともRTEは15.67倍、RREは12.64倍改善されている。
私たちの実装はhttps://github.com/IRMVLab/DSLOで公開されます。
関連論文リスト
- Future Does Matter: Boosting 3D Object Detection with Temporal Motion Estimation in Point Cloud Sequences [25.74000325019015]
クロスフレーム動作予測情報を用いた時空間特徴学習を容易にするために,新しいLiDAR 3Dオブジェクト検出フレームワークLiSTMを導入する。
我々は,本フレームワークが優れた3次元検出性能を実現することを示すため,アグリゲーションとnuScenesデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-09-06T16:29:04Z) - Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.232688209606515]
カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。
提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文 参考訳(メタデータ) (2024-07-02T09:11:17Z) - Motion-aware Memory Network for Fast Video Salient Object Detection [15.967509480432266]
我々は、隣接するフレームから現在のフレームの有用な時間情報をVSODの時間枝として抽出する時空間メモリ(STM)ベースのネットワークを設計する。
符号化段階では、電流とその隣接するフレームから高次特徴を用いて高次時間特徴を生成する。
復号化段階では,空間的および時間的分岐に対する効果的な融合戦略を提案する。
提案モデルでは,光学フローなどの前処理を必要とせず,推定時に100FPS近い速度に達することができる。
論文 参考訳(メタデータ) (2022-08-01T15:56:19Z) - LiDARCap: Long-range Marker-less 3D Human Motion Capture with LiDAR
Point Clouds [58.402752909624716]
既存のモーションキャプチャデータセットはほとんどが短距離であり、まだ長距離アプリケーションのニーズに合わない。
我々は,この制限を克服するために,LiDARがより長い範囲で捉えた新しい人間のモーションキャプチャーデータセットLiDARHuman26Mを提案する。
我々のデータセットには、IMUシステムによって取得された人間の動きと同期RGB画像も含まれている。
論文 参考訳(メタデータ) (2022-03-28T12:52:45Z) - Roadside Lidar Vehicle Detection and Tracking Using Range And Intensity
Background Subtraction [0.0]
本稿では,2つの教師なし学習アルゴリズムを組み合わせた道路側LiDAR物体検出手法を提案する。
この手法は商用トラフィックデータ収集プラットフォームに対して検証された。
論文 参考訳(メタデータ) (2022-01-13T00:54:43Z) - Decoupling and Recoupling Spatiotemporal Representation for RGB-D-based
Motion Recognition [62.46544616232238]
従来の動作認識手法は、密結合した多時間表現によって有望な性能を実現している。
本稿では,RGB-D に基づく動作認識において引き起こされた表現を分離し,再分離することを提案する。
論文 参考訳(メタデータ) (2021-12-16T18:59:47Z) - Efficient 3D Deep LiDAR Odometry [16.388259779644553]
PWCLO-Netという名前の効率的な3Dポイント・クラウド・ラーニング・アーキテクチャが最初に提案される。
アーキテクチャ全体は、コストボリュームとマスクの適応的な学習を実現するために、徹底的にエンドツーエンドに最適化されています。
論文 参考訳(メタデータ) (2021-11-03T11:09:49Z) - PWCLO-Net: Deep LiDAR Odometry in 3D Point Clouds Using Hierarchical
Embedding Mask Optimization [17.90299648470637]
本稿では,PWCLO-Netと呼ばれる深部LiDAR計測のための3Dポイントクラウド学習モデルを提案する。
このモデルでは,LiDARオドメトリータスクのためのピラミッド,ウォーピング,コストボリューム構造を構築し,粗大なアプローチで推定されたポーズを階層的に洗練する。
提案手法は,KITTI odometry データセットのほとんどのシーケンスにおいて,最近の学習手法より優れ,マッピング最適化による幾何学的アプローチ LOAM よりも優れている。
論文 参考訳(メタデータ) (2020-12-02T05:23:41Z) - ePointDA: An End-to-End Simulation-to-Real Domain Adaptation Framework
for LiDAR Point Cloud Segmentation [111.56730703473411]
LiDARデータ上でディープニューラルネットワーク(DNN)をトレーニングするには、大規模なポイントワイドアノテーションが必要である。
シミュレーション・トゥ・リアル・ドメイン適応(SRDA)は、DNNを無制限の合成データと自動生成されたラベルで訓練する。
ePointDAは、自己教師付きドロップアウトノイズレンダリング、統計不変および空間適応型特徴アライメント、転送可能なセグメンテーション学習の3つのモジュールで構成されている。
論文 参考訳(メタデータ) (2020-09-07T23:46:08Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。