論文の概要: BabyMamba-HAR: Lightweight Selective State Space Models for Efficient Human Activity Recognition on Resource Constrained Devices
- arxiv url: http://arxiv.org/abs/2602.09872v1
- Date: Tue, 10 Feb 2026 15:16:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.632103
- Title: BabyMamba-HAR: Lightweight Selective State Space Models for Efficient Human Activity Recognition on Resource Constrained Devices
- Title(参考訳): BabyMamba-HAR:資源制約デバイス上での効率的な人間活動認識のための軽量選択状態空間モデル
- Authors: Mridankan Mandal,
- Abstract要約: ウェアラブルおよびモバイルデバイス上のヒューマンアクティビティ認識(HAR)は、メモリフットプリントと計算予算によって制限される。
選択状態空間モデル(SSM)は入力依存ゲーティングによる線形時間列処理を提供する。
BabyMamba-HARは、リソース制約されたHARのための2つの新しい軽量なMambaインスパイアされたアーキテクチャからなるフレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Human activity recognition (HAR) on wearable and mobile devices is constrained by memory footprint and computational budget, yet competitive accuracy must be maintained across heterogeneous sensor configurations. Selective state space models (SSMs) offer linear time sequence processing with input dependent gating, presenting a compelling alternative to quadratic complexity attention mechanisms. However, the design space for deploying SSMs in the TinyML regime remains largely unexplored. In this paper, BabyMamba-HAR is introduced, a framework comprising two novel lightweight Mamba inspired architectures optimized for resource constrained HAR: (1) CI-BabyMamba-HAR, using a channel independent stem that processes each sensor channel through shared weight, but instance independent transformations to prevent cross channel noise propagation, and (2) Crossover-BiDir-BabyMamba-HAR, using an early fusion stem that achieves channel count independent computational complexity. Both variants incorporate weight tied bidirectional scanning and lightweight temporal attention pooling. Through evaluation across eight diverse benchmarks, it is demonstrated that Crossover-BiDir-BabyMamba-HAR achieves 86.52% average macro F1-score with approximately 27K parameters and 2.21M MACs, matching TinyHAR (86.16%) while requiring 11x fewer MACs on high channel datasets. Systematic ablation studies reveal that bidirectional scanning contributes up to 8.42% F1-score improvement, and gated temporal attention provides up to 8.94% F1-score gain over mean pooling. These findings establish practical design principles for deploying selective state space models as efficient TinyML backbones for HAR.
- Abstract(参考訳): ウェアラブルおよびモバイルデバイス上のヒューマンアクティビティ認識(HAR)は、メモリフットプリントと計算予算によって制限されるが、不均一なセンサー構成で競合精度を維持する必要がある。
選択状態空間モデル(SSM)は、入力依存ゲーティングによる線形時間列処理を提供し、二次的複雑性の注意機構に代わる魅力的な代替手段を提供する。
しかし、TinyML体制でSSMをデプロイするための設計領域はほとんど未検討のままである。
本稿では,(1)CI-BabyMamba-HAR,(1)CI-BabyMamba-HAR,(2)CI-BabyMamba-HAR,(2)クロスチャネルノイズ伝搬を防止するために,各センサチャネルを共有重みで処理するチャネル独立系,(2)クロスオーバー・BiDir-BabyMamba-HAR,(2)チャネルカウント独立計算複雑性を実現する早期融合系,という2つの軽量なMamba-HARアーキテクチャからなるフレームワークを紹介する。
どちらも重み付き双方向走査と軽量の時間的アテンションプールを備えている。
8つの異なるベンチマークで評価した結果、クロスオーバー・バイダー・ベイビー・マンバ-HARは平均86.52%のマクロF1スコアを約27Kパラメータと2.21M MACで達成し、TinyHAR (86.16%) と一致し、高いチャネルデータセットでは11倍のMACを必要とすることが示された。
系統的アブレーション研究により、双方向走査はF1スコアの改善に最大8.42%、時間的注意が平均プールよりも最大8.94%の利得をもたらすことが明らかになった。
これらの知見は,HARの効率的なTinyMLバックボーンとして選択状態空間モデルをデプロイするための実用的な設計原理を確立した。
関連論文リスト
- MicroBi-ConvLSTM: An Ultra-Lightweight Efficient Model for Human Activity Recognition on Resource Constrained Devices [0.0]
リソース制約のあるウェアラブル上でのヒューマンアクティビティ認識(HAR)は、厳格なメモリと計算予算との精度のバランスをとるモデルを必要とする。
提案するMicroBi-ConvLSTMは, 平均11.4Kのパラメータを達成できる超軽量畳み込み並列アーキテクチャである。
論文 参考訳(メタデータ) (2026-02-06T09:26:29Z) - RadMamba: Efficient Human Activity Recognition through Radar-based Micro-Doppler-Oriented Mamba State-Space Model [4.200994756075655]
本稿では,レーダベースHARに特化して,パラメータ効率の高いマイクロドップラー指向のMamba SSMであるRadMambaを紹介する。
3つの多様なデータセットの中で、RadMambaは前モデルの99.8%の分類精度でトップパフォーマンスのモデルと一致している。
論文 参考訳(メタデータ) (2025-04-16T12:54:11Z) - Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - Short-Long Convolutions Help Hardware-Efficient Linear Attention to Focus on Long Sequences [60.489682735061415]
本稿では,状態空間モデルを短時間の畳み込みに置き換えたCHELAを提案する。
提案手法の有効性を示すために,Long Range Arenaベンチマークと言語モデリングタスクについて実験を行った。
論文 参考訳(メタデータ) (2024-06-12T12:12:38Z) - HARMamba: Efficient and Lightweight Wearable Sensor Human Activity Recognition Based on Bidirectional Mamba [7.412537185607976]
ウェアラブルセンサーによる人間の活動認識(HAR)は、活動知覚において重要な研究領域である。
HARMambaは、選択的な双方向状態空間モデルとハードウェア対応設計を組み合わせた、革新的な軽量で多用途なHARアーキテクチャである。
HarMambaは現代の最先端フレームワークより優れており、計算とメモリの要求を大幅に削減し、同等またはより良い精度を提供する。
論文 参考訳(メタデータ) (2024-03-29T13:57:46Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。