論文の概要: HARMamba: Efficient Wearable Sensor Human Activity Recognition Based on Bidirectional Selective SSM
- arxiv url: http://arxiv.org/abs/2403.20183v1
- Date: Fri, 29 Mar 2024 13:57:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 15:34:34.137522
- Title: HARMamba: Efficient Wearable Sensor Human Activity Recognition Based on Bidirectional Selective SSM
- Title(参考訳): HARMamba:双方向選択SSMに基づく効率的なウェアラブルセンサヒューマンアクティビティ認識
- Authors: Shuangjian Li, Tao Zhu, Furong Duan, Liming Chen, Huansheng Ning, Yaping Wan,
- Abstract要約: 本稿では、より軽量な選択的SSMをアクティビティ認識の基盤モデルアーキテクチャとして採用したHARMambaを紹介する。
私たちのアプローチでは、各チャネルを独立して学習し、データを“パッチ”に分割することで、センサデータフローを処理する。
Transformerベースのモデルのような既存のアクティビティ認識フレームワークと比較して、HARMambaは計算とメモリオーバーヘッドを低減しつつ、優れたパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 7.784244204592032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wearable sensor human activity recognition (HAR) is a crucial area of research in activity sensing. While transformer-based temporal deep learning models have been extensively studied and implemented, their large number of parameters present significant challenges in terms of system computing load and memory usage, rendering them unsuitable for real-time mobile activity recognition applications. Recently, an efficient hardware-aware state space model (SSM) called Mamba has emerged as a promising alternative. Mamba demonstrates strong potential in long sequence modeling, boasts a simpler network architecture, and offers an efficient hardware-aware design. Leveraging SSM for activity recognition represents an appealing avenue for exploration. In this study, we introduce HARMamba, which employs a more lightweight selective SSM as the foundational model architecture for activity recognition. The goal is to address the computational resource constraints encountered in real-time activity recognition scenarios. Our approach involves processing sensor data flow by independently learning each channel and segmenting the data into "patches". The marked sensor sequence's position embedding serves as the input token for the bidirectional state space model, ultimately leading to activity categorization through the classification head. Compared to established activity recognition frameworks like Transformer-based models, HARMamba achieves superior performance while also reducing computational and memory overhead. Furthermore, our proposed method has been extensively tested on four public activity datasets: PAMAP2, WISDM, UNIMIB, and UCI, demonstrating impressive performance in activity recognition tasks.
- Abstract(参考訳): ウェアラブルセンサによる人間の活動認識(HAR)は、活動センシングにおいて重要な研究領域である。
トランスフォーマーに基づく時間的深層学習モデルは広く研究され実装されているが、その多くのパラメータはシステムコンピューティングの負荷とメモリ使用量において重大な課題を示しており、リアルタイムなモバイルアクティビティ認識アプリケーションには適さない。
近年,Mamba と呼ばれる効率的なハードウェア対応状態空間モデル (SSM) が有望な代替手段として登場している。
Mambaは、長いシーケンスモデリングにおいて強力なポテンシャルを示し、より単純なネットワークアーキテクチャを持ち、効率的なハードウェア・アウェア・デザインを提供する。
活動認識のためのSSMを活用することは、探索のための魅力的な道である。
本研究では,より軽量な選択的SSMをアクティビティ認識の基本モデルアーキテクチャとして採用したHARMambaを紹介する。
目標は、リアルタイムのアクティビティ認識シナリオで発生する計算リソースの制約に対処することである。
このアプローチでは、各チャネルを独立して学習し、データを“パッチ”に分割することで、センサデータフローを処理する。
マークされたセンサシーケンスの位置埋め込みは、双方向状態空間モデルの入力トークンとして機能し、最終的に分類ヘッドによるアクティビティの分類に繋がる。
Transformerベースのモデルのような既存のアクティビティ認識フレームワークと比較して、HARMambaは計算とメモリオーバーヘッドを低減しつつ、優れたパフォーマンスを実現している。
さらに,本手法は, PAMAP2, WISDM, UNIMIB, UCIの4つの公的な活動データセットに対して広範に検証され, 活動認識タスクにおける顕著な性能を示した。
関連論文リスト
- Bidirectional Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - Mamba-Spike: Enhancing the Mamba Architecture with a Spiking Front-End for Efficient Temporal Data Processing [4.673285689826945]
Mamba-Spikeは、スパイクするフロントエンドとMambaのバックボーンを統合して、効率的な時間的データ処理を実現する新しいニューロモルフィックアーキテクチャである。
このアーキテクチャは、最先端のベースラインを一貫して上回り、高い精度、低いレイテンシ、エネルギー効率の向上を実現している。
論文 参考訳(メタデータ) (2024-08-04T14:10:33Z) - Initial Investigation of Kolmogorov-Arnold Networks (KANs) as Feature Extractors for IMU Based Human Activity Recognition [5.067238125081022]
我々はIMUに基づく人間活動認識タスクの機能抽出アーキテクチャとしてKanを実装した。
本研究では,4つの公開HARデータセット上でのkan-based feature extractorの性能評価を行った。
論文 参考訳(メタデータ) (2024-06-16T19:56:03Z) - HSIMamba: Hyperpsectral Imaging Efficient Feature Learning with Bidirectional State Space for Classification [16.742768644585684]
HSIMambaは、双方向の逆畳み込みニューラルネットワークパスを使用して、スペクトル特徴をより効率的に抽出する新しいフレームワークである。
提案手法は,CNNの動作効率と,トランスフォーマに見られる注意機構の動的特徴抽出機能を組み合わせたものである。
このアプローチは、現在のベンチマークを超えて分類精度を改善し、トランスフォーマーのような高度なモデルで遭遇する計算の非効率性に対処する。
論文 参考訳(メタデータ) (2024-03-30T07:27:36Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - UMSNet: An Universal Multi-sensor Network for Human Activity Recognition [10.952666953066542]
本稿では,人間行動認識のためのユニバーサルマルチセンサネットワーク(UMSNet)を提案する。
特に,新しい軽量センサ残差ブロック(LSRブロック)を提案する。
我々のフレームワークは明確な構造を持ち、様々な種類のマルチモーダル時系列分類タスクに直接適用することができる。
論文 参考訳(メタデータ) (2022-05-24T03:29:54Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Human Activity Recognition using Attribute-Based Neural Networks and
Context Information [61.67246055629366]
手作業におけるウェアラブルセンサデータから人間の活動認識(HAR)を考察する。
我々は、コンテキスト情報をディープニューラルネットワークベースのHARシステムに体系的に組み込む方法を示す。
提案したアーキテクチャは,最先端手法と比較してHAR性能が向上することを示す。
論文 参考訳(メタデータ) (2021-10-28T06:08:25Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Automated Human Activity Recognition by Colliding Bodies
Optimization-based Optimal Feature Selection with Recurrent Neural Network [0.0]
HAR(Human Activity Recognition)は、センサの読み取りから広範に計算を行う上で、効率的なモデルであると考えられている。
本稿では,UC Irvine Machine Learning Repository(UCI)で公開されているスマートセンサから収集したデータを用いて,ディープラーニングを用いたHARシステムの実装を誘致する。
論文 参考訳(メタデータ) (2020-10-07T10:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。