論文の概要: TTPOINT: A Tensorized Point Cloud Network for Lightweight Action
Recognition with Event Cameras
- arxiv url: http://arxiv.org/abs/2308.09993v1
- Date: Sat, 19 Aug 2023 11:58:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 18:29:14.257338
- Title: TTPOINT: A Tensorized Point Cloud Network for Lightweight Action
Recognition with Event Cameras
- Title(参考訳): TTPOINT:イベントカメラを用いた軽量行動認識のためのテンソル化ポイントクラウドネットワーク
- Authors: Hongwei Ren, Yue Zhou, Haotian Fu, Yulong Huang, Renjing Xu, Bojun
Cheng
- Abstract要約: イベントカメラは、従来のフレームベースの手法と互換性のないスパースおよび非同期データを生成する。
我々は,動作認識タスクにおけるSOTA(State-of-the-art)フレームベースの手法と比較しても,結果が得られるTTPOINTというポイントクラウドネットワークを提案する。
- 参考スコア(独自算出の注目度): 5.925545594655497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event cameras have gained popularity in computer vision due to their data
sparsity, high dynamic range, and low latency. As a bio-inspired sensor, event
cameras generate sparse and asynchronous data, which is inherently incompatible
with the traditional frame-based method. Alternatively, the point-based method
can avoid additional modality transformation and naturally adapt to the
sparsity of events. Still, it typically cannot reach a comparable accuracy as
the frame-based method. We propose a lightweight and generalized point cloud
network called TTPOINT which achieves competitive results even compared to the
state-of-the-art (SOTA) frame-based method in action recognition tasks while
only using 1.5 % of the computational resources. The model is adept at
abstracting local and global geometry by hierarchy structure. By leveraging
tensor-train compressed feature extractors, TTPOINT can be designed with
minimal parameters and computational complexity. Additionally, we developed a
straightforward downsampling algorithm to maintain the spatio-temporal feature.
In the experiment, TTPOINT emerged as the SOTA method on three datasets while
also attaining SOTA among point cloud methods on all five datasets. Moreover,
by using the tensor-train decomposition method, the accuracy of the proposed
TTPOINT is almost unaffected while compressing the parameter size by 55 % in
all five datasets.
- Abstract(参考訳): イベントカメラは、データ空間、高いダイナミックレンジ、低レイテンシにより、コンピュータビジョンで人気を博している。
バイオインスパイアされたセンサとして、イベントカメラはスパースと非同期のデータを生成する。
あるいは、ポイントベースの方法は追加のモダリティ変換を避け、イベントのスパーシティに自然に適応することができる。
しかし、通常はフレームベースの方法と同等の精度に到達できない。
本稿では,アクション認識タスクにおける最先端(sota)フレームベース手法と比較しても,計算資源の1.5%しか使用せず,競争力のある結果が得られるttpointと呼ばれる軽量で汎用的なポイントクラウドネットワークを提案する。
このモデルは、階層構造による局所的および大域的幾何学の抽象化に適している。
テンソルトレイン圧縮特徴抽出器を利用することで、TTPOINTは最小限のパラメータと計算複雑性で設計できる。
さらに,時空間特性を維持するための簡易なダウンサンプリングアルゴリズムを開発した。
実験では、TTPOINTが3つのデータセットのSOTAメソッドとして現れ、同時に5つのデータセットのポイントクラウドメソッドのSOTAも達成した。
さらに, テンソル-トレイン分解法を用いて, 5つのデータセットのパラメータサイズを55%圧縮しながら, 提案したTTPOINTの精度にほとんど影響を与えない。
関連論文リスト
- Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement [19.575833741231953]
我々は、KNN法を用いて、原表面点の近傍を決定する。
条件付き確率モデルは局所幾何学に適応し、大きな速度減少をもたらす。
暗黙のニューラル表現を精製層に組み込むことで、デコーダは任意の密度で下面の点をサンプリングすることができる。
論文 参考訳(メタデータ) (2024-08-06T05:24:06Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - VPIT: Real-time Embedded Single Object 3D Tracking Using Voxel Pseudo Images [90.60881721134656]
本稿では,Voxel Pseudo Image Tracking (VPIT) という,Voxel-based 3D Single Object Tracking (3D SOT) 手法を提案する。
KITTI追跡データセットの実験は、VPITが最速の3D SOT法であり、競合的な成功と精度の値を維持することを示している。
論文 参考訳(メタデータ) (2022-06-06T14:02:06Z) - CpT: Convolutional Point Transformer for 3D Point Cloud Processing [10.389972581905]
CpT: Convolutional Point Transformer - 3Dポイントクラウドデータの非構造化の性質を扱うための新しいディープラーニングアーキテクチャ。
CpTは、既存の注目ベースのConvolutions Neural Networksと、以前の3Dポイントクラウド処理トランスフォーマーの改善である。
我々のモデルは、既存の最先端のアプローチと比較して、様々なポイントクラウド処理タスクの効果的なバックボーンとして機能する。
論文 参考訳(メタデータ) (2021-11-21T17:45:55Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Spherical Interpolated Convolutional Network with Distance-Feature
Density for 3D Semantic Segmentation of Point Clouds [24.85151376535356]
従来のグリッド形状の3次元畳み込み演算子を置き換えるために,球面補間畳み込み演算子を提案する。
提案手法は,ScanNetデータセットとParis-Lille-3Dデータセットで良好な性能を示す。
論文 参考訳(メタデータ) (2020-11-27T15:35:12Z) - Local Grid Rendering Networks for 3D Object Detection in Point Clouds [98.02655863113154]
CNNは強力だが、全点の雲を高密度の3Dグリッドに酸化した後、点データに直接畳み込みを適用するのは計算コストがかかる。
入力点のサブセットの小さな近傍を低解像度の3Dグリッドに独立してレンダリングする,新しい,原理化されたローカルグリッドレンダリング(LGR)演算を提案する。
ScanNetとSUN RGB-Dデータセットを用いた3次元オブジェクト検出のためのLGR-Netを検証する。
論文 参考訳(メタデータ) (2020-07-04T13:57:43Z) - StickyPillars: Robust and Efficient Feature Matching on Point Clouds
using Graph Neural Networks [16.940377259203284]
StickyPillarsは、ポイントクラウド上の高速で正確で、非常に堅牢な3D機能マッチング方法である。
KITTIデータセット上で実証された登録問題に対して,最先端技術による精度評価結果を示す。
我々はマッチングシステムをLiDARオドメトリーパイプラインに統合し、KITTIデータセット上で最も正確な結果を得る。
論文 参考訳(メタデータ) (2020-02-10T17:53:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。