論文の概要: OG-PCL: Efficient Sparse Point Cloud Processing for Human Activity Recognition
- arxiv url: http://arxiv.org/abs/2511.08910v1
- Date: Thu, 13 Nov 2025 01:16:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.294453
- Title: OG-PCL: Efficient Sparse Point Cloud Processing for Human Activity Recognition
- Title(参考訳): OG-PCL:人間の活動認識のための効率的なスパースポイントクラウド処理
- Authors: Jiuqi Yan, Chendong Xu, Dongyu Liu,
- Abstract要約: ミリ波(mmWave)レーダーによる人間の活動認識は、カメラおよびウェアラブルベースのアプローチに対するプライバシー保護と堅牢な代替手段を提供する。
そこで我々は,mmWave センシングにより発生する疎3次元レーダ点雲を処理するために,Occupancy-Gated Parallel-CNN Bi-LSTM (OG-PCL) ネットワークを提案する。
- 参考スコア(独自算出の注目度): 4.637823044029562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human activity recognition (HAR) with millimeter-wave (mmWave) radar offers a privacy-preserving and robust alternative to camera- and wearable-based approaches. In this work, we propose the Occupancy-Gated Parallel-CNN Bi-LSTM (OG-PCL) network to process sparse 3D radar point clouds produced by mmWave sensing. Designed for lightweight deployment, the parameter size of the proposed OG-PCL is only 0.83M and achieves 91.75 accuracy on the RadHAR dataset, outperforming those existing baselines such as 2D CNN, PointNet, and 3D CNN methods. We validate the advantages of the tri-view parallel structure in preserving spatial information across three dimensions while maintaining efficiency through ablation studies. We further introduce the Occupancy-Gated Convolution (OGConv) block and demonstrate the necessity of its occupancy compensation mechanism for handling sparse point clouds. The proposed OG-PCL thus offers a compact yet accurate framework for real-time radar-based HAR on lightweight platforms.
- Abstract(参考訳): ミリ波(mmWave)レーダーを用いたHAR(Human Activity Recognition)は、カメラおよびウェアラブルベースのアプローチに対して、プライバシ保護と堅牢な代替手段を提供する。
そこで本研究では,mmWave センシングにより発生する疎3次元レーダ点雲を処理するために,Occupancy-Gated Parallel-CNN Bi-LSTM (OG-PCL) ネットワークを提案する。
軽量な展開のために設計されたOG-PCLのパラメータサイズはわずか0.83Mで、RadHARデータセット上で91.75の精度を実現しており、2D CNN、PointNet、および3D CNNメソッドなどの既存のベースラインよりも優れている。
本研究では,3次元にわたる空間情報保存における3次元並列構造の利点を,アブレーション研究を通じて効率を保ちながら検証した。
さらに、OGConv(Occupancy-Gated Convolution)ブロックを導入し、その占有補償機構がスパースポイント雲の処理に必要であることを示す。
提案したOG-PCLは、軽量プラットフォーム上でのリアルタイムレーダベースのHARのためのコンパクトで正確なフレームワークを提供する。
関連論文リスト
- LAMP: Data-Efficient Linear Affine Weight-Space Models for Parameter-Controlled 3D Shape Generation and Extrapolation [4.182541493191528]
制御可能かつ解釈可能な3D生成のためのフレームワークであるLAMPを紹介する。
LAMPをDrivAerNet++とBlendedNetの2つの3次元パラメトリック幾何ベンチマークで評価した。
以上の結果から,LAMPは制御可能で,データ効率が高く,安全な3D生成が可能であることが示唆された。
論文 参考訳(メタデータ) (2025-10-26T02:12:20Z) - Optimized CNNs for Rapid 3D Point Cloud Object Recognition [2.6462438855724826]
本研究では,畳み込みニューラルネットワーク(CNN)を用いて3次元点雲内の物体を効率的に検出する手法を提案する。
提案手法では特徴中心の投票機構を採用して,入力データで観測される典型的な疎度を生かした畳み込み層を構築する。
Vote3Deepモデルは、わずか3層で、レーザーのみのアプローチとレーザービジョンを組み合わせた手法の両方において、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2024-12-03T21:42:30Z) - PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - SPADE: Sparse Pillar-based 3D Object Detection Accelerator for
Autonomous Driving [18.745798346661097]
ポイントクラウド(PC)データを用いた3次元物体検出は、自律運転の知覚パイプラインに不可欠である。
広く採用されている鳥眼ビュー(BEV)エンコーディングであるPointPillarsは、高速で正確な3Dオブジェクト検出のために、3Dポイントクラウドデータを2Dピラーに集約する。
柱型3次元物体検出におけるベクトル空間の幅を最大化し,ベクトルスパース畳み込みを高速化するアルゴリズム・ハードウェア協調設計手法であるSPADEを提案する。
論文 参考訳(メタデータ) (2023-05-12T14:38:49Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - Multi Projection Fusion for Real-time Semantic Segmentation of 3D LiDAR
Point Clouds [2.924868086534434]
本稿では,ポイントクラウドの複数のプロジェクションを利用する3次元ポイントクラウドセマンティックセマンティックセマンティクスの新しいアプローチを提案する。
我々のMulti-Projection Fusionフレームワークは、2つの異なる高効率2次元完全畳み込みモデルを用いて球面および鳥眼の視射影を解析する。
論文 参考訳(メタデータ) (2020-11-03T19:40:43Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。