論文の概要: Spatiotemporal Transformer Attention Network for 3D Voxel Level Joint
Segmentation and Motion Prediction in Point Cloud
- arxiv url: http://arxiv.org/abs/2203.00138v1
- Date: Mon, 28 Feb 2022 23:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-03 01:15:47.870085
- Title: Spatiotemporal Transformer Attention Network for 3D Voxel Level Joint
Segmentation and Motion Prediction in Point Cloud
- Title(参考訳): 点群における3次元ボクセルレベル関節分割と運動予測のための時空間変圧器注意ネットワーク
- Authors: Zhensong Wei, Xuewei Qi, Zhengwei Bai, Guoyuan Wu, Saswat Nayak, Peng
Hao, Matthew Barth, Yongkang Liu, and Kentaro Oguchi
- Abstract要約: 自動走行システムとインテリジェント輸送アプリケーションにとって、モーション予測は重要な有効性である。
現在の課題は、異なる知覚タスクを単一のバックボーンに効果的に組み合わせることである。
本稿では,共同セマンティックセグメンテーションのためのトランスフォーマ自己アテンション機構に基づく新しいアテンションネットワークを提案する。
- 参考スコア(独自算出の注目度): 9.570438238511073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Environment perception including detection, classification, tracking, and
motion prediction are key enablers for automated driving systems and
intelligent transportation applications. Fueled by the advances in sensing
technologies and machine learning techniques, LiDAR-based sensing systems have
become a promising solution. The current challenges of this solution are how to
effectively combine different perception tasks into a single backbone and how
to efficiently learn the spatiotemporal features directly from point cloud
sequences. In this research, we propose a novel spatiotemporal attention
network based on a transformer self-attention mechanism for joint semantic
segmentation and motion prediction within a point cloud at the voxel level. The
network is trained to simultaneously outputs the voxel level class and
predicted motion by learning directly from a sequence of point cloud datasets.
The proposed backbone includes both a temporal attention module (TAM) and a
spatial attention module (SAM) to learn and extract the complex spatiotemporal
features. This approach has been evaluated with the nuScenes dataset, and
promising performance has been achieved.
- Abstract(参考訳): 検知、分類、追跡、動き予測を含む環境認識は、自動走行システムとインテリジェント輸送アプリケーションにとって重要な実現手段である。
センサー技術と機械学習技術の進歩により、LiDARベースのセンシングシステムは有望なソリューションとなっている。
このソリューションの現在の課題は、異なる知覚タスクを単一のバックボーンに効果的に組み合わせることと、ポイントクラウドシーケンスから直接時空間的特徴を効率的に学習する方法である。
本研究では,ボクセルレベルの点雲内における共同意味セグメンテーションと動き予測のための変圧器自己認識機構に基づく新しい時空間アテンションネットワークを提案する。
ネットワークは、ポイントクラウドデータセットのシーケンスから直接学習することにより、voxelレベルクラスと予測動作を同時に出力するように訓練される。
提案するバックボーンは、時間的注意モジュール(TAM)と空間的注意モジュール(SAM)の両方を含み、複雑な時空間の特徴を学習し抽出する。
このアプローチはnuScenesデータセットで評価されており、有望なパフォーマンスを実現している。
関連論文リスト
- Self-Supervised Class-Agnostic Motion Prediction with Spatial and Temporal Consistency Regularizations [53.797896854533384]
クラスに依存しない動き予測法は点雲全体の動きを直接予測する。
既存のほとんどのメソッドは、完全に教師付き学習に依存しているが、ポイントクラウドデータの手作業によるラベル付けは、手間と時間を要する。
3つの簡単な空間的・時間的正則化損失を導入し,自己指導型学習プロセスの効率化を図る。
論文 参考訳(メタデータ) (2024-03-20T02:58:45Z) - A Generic Approach to Integrating Time into Spatial-Temporal Forecasting
via Conditional Neural Fields [1.7661845949769062]
本稿では,時間成分を予測モデルに統合する一般的な手法を提案する。
主要なアイデアは、時間成分から抽出された補助的特徴を表現するために条件付きニューラルネットワークを使用することである。
道路交通とセルラーネットワーク交通データセットの実験は,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-05-11T14:20:23Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Self-Supervised Pillar Motion Learning for Autonomous Driving [10.921208239968827]
本研究では,点群からの自由監視信号と対カメラ画像を利用した学習フレームワークを提案する。
本モデルでは,確率的運動マスキングを付加した点雲に基づく構造整合性と,所望の自己超越を実現するためのクロスセンサ運動正規化を含む。
論文 参考訳(メタデータ) (2021-04-18T02:32:08Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Self-Supervised Learning of Part Mobility from Point Cloud Sequence [9.495859862104515]
動的対象を表す点列から,部品のセグメント化と動作特性の予測を行う自己教師型手法を提案する。
シーケンスの連続するフレーム間の相関を利用してトラジェクトリを生成する。
動作部分分割, 動き軸予測, 動き範囲推定など, 様々なタスクにおける提案手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-20T11:29:46Z) - A Prospective Study on Sequence-Driven Temporal Sampling and Ego-Motion
Compensation for Action Recognition in the EPIC-Kitchens Dataset [68.8204255655161]
行動認識はコンピュータビジョンにおける最上位の研究分野の一つである。
エゴモーション記録シーケンスは重要な関連性を持つようになった。
提案手法は,このエゴモーションやカメラの動きを推定して対処することを目的としている。
論文 参考訳(メタデータ) (2020-08-26T14:44:45Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Any Motion Detector: Learning Class-agnostic Scene Dynamics from a
Sequence of LiDAR Point Clouds [4.640835690336654]
動き検出と動きパラメータ推定のための時間的文脈アグリゲーションの新しいリアルタイム手法を提案する。
本稿では,固有点雲列の固有オドメトリック変換に匹敵する性能で,リアルタイムな推論を実現するためのエゴモーション補償層を提案する。
論文 参考訳(メタデータ) (2020-04-24T10:40:07Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。