論文の概要: SPECTRA: An Efficient Spectral-Informed Neural Network for Sensor-Based Activity Recognition
- arxiv url: http://arxiv.org/abs/2603.26482v1
- Date: Fri, 27 Mar 2026 14:45:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.552052
- Title: SPECTRA: An Efficient Spectral-Informed Neural Network for Sensor-Based Activity Recognition
- Title(参考訳): SPECTRA: センサによる活動認識のための効率的なスペクトルインフォームニューラルネットワーク
- Authors: Deepika Gurung, Lala Shakti Swarup Ray, Mengxi Liu, Bo Zhou, Paul Lukowicz,
- Abstract要約: 広範コンピューティングにおけるリアルタイムセンサベースのアプリケーションは、低レイテンシのプライバシと効率的なインタラクションを保証するために、エッジデプロイ可能なモデルを必要とする。
SPECTRAは、短時間のフーリエ変換STFT特徴抽出とチャネルワイズ・セルフアテンションを統合し、実エッジランタイムとメモリ制約下でのスペクトル時間依存性をキャプチャする。
注目プーリングを施したコンパクトな双方向GRUは、精度を保ちながら、低コストでダウンストリームモデルの負担を軽減する。
- 参考スコア(独自算出の注目度): 11.283502671153109
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real time sensor based applications in pervasive computing require edge deployable models to ensure low latency privacy and efficient interaction. A prime example is sensor based human activity recognition where models must balance accuracy with stringent resource constraints. Yet many deep learning approaches treat temporal sensor signals as black box sequences overlooking spectral temporal structure while demanding excessive computation. We present SPECTRA a deployment first co designed spectral temporal architecture that integrates short time Fourier transform STFT feature extraction depthwise separable convolutions and channel wise self attention to capture spectral temporal dependencies under real edge runtime and memory constraints. A compact bidirectional GRU with attention pooling summarizes within window dynamics at low cost reducing downstream model burden while preserving accuracy. Across five public HAR datasets SPECTRA matches or approaches larger CNN LSTM and Transformer baselines while substantially reducing parameters latency and energy. Deployments on a Google Pixel 9 smartphone and an STM32L4 microcontroller further demonstrate end to end deployable realtime private and efficient HAR.
- Abstract(参考訳): 広範コンピューティングにおけるリアルタイムセンサベースのアプリケーションは、低レイテンシのプライバシと効率的なインタラクションを保証するために、エッジデプロイ可能なモデルを必要とする。
主な例として、センサベースのヒューマンアクティビティ認識があり、モデルが厳密なリソース制約と正確さのバランスを取る必要がある。
しかし、多くのディープラーニングアプローチは、過度の計算を要求しながらスペクトル時間構造を見渡すブラックボックスシーケンスとして時間センサ信号を扱います。
SPECTRAは、短時間のフーリエ変換STFT特徴抽出とチャネルワイズ・セルフアテンションを統合し、実エッジランタイムとメモリ制約下でのスペクトル時間依存性をキャプチャする。
注目プーリングを備えたコンパクトな双方向GRUは、精度を保ちながら、ダウンストリームモデルの負荷を低減し、低コストでウィンドウダイナミックス内を要約する。
5つの公開HARデータセットにわたるSPECTRAは、より大きなCNN LSTMとTransformerベースラインにマッチまたはアプローチすると同時に、パラメータのレイテンシとエネルギを大幅に削減する。
Google Pixel 9スマートフォンとSTM32L4マイクロコントローラへのデプロイはさらに、エンド・ツー・エンドのデプロイ可能なリアルタイムプライベートかつ効率的なHARを実証している。
関連論文リスト
- LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - No One-Model-Fits-All: Uncovering Spatio-Temporal Forecasting Trade-offs with Graph Neural Networks and Foundation Models [8.918505166222875]
本研究は,空間センサ密度とサンプリング間隔の異なる予測モデルについて,系統的研究を行った。
以上の結果から,STGはセンサ配置が小さく,サンプリングレートが適度である場合に有効であることが示唆された。
重要なことは、TSFMは高周波で競合するが、隣り合うセンサーからの空間被覆が減少すると劣化する。
論文 参考訳(メタデータ) (2025-11-07T11:50:39Z) - Neural-HAR: A Dimension-Gated CNN Accelerator for Real-Time Radar Human Activity Recognition [5.400353553418959]
本稿では,資源制約のあるプラットフォーム上でのリアルタイムレーダHARに適した次元ゲート型CNNアクセラレータを提案する。
GateCNNの精度は86.4%で、パラメータは2.7kで、推論あたり0.28M FLOPはCNN-BiGRUに匹敵する。
Xilinx Zynq-7000 Z-7007SのFPGAプロトタイプは、LUTベースのROMと分散RAMのみを使用した107.5$mu$sレイテンシと15mWのダイナミックパワーを実現しました。
論文 参考訳(メタデータ) (2025-10-26T17:42:28Z) - A Spatial-Frequency Aware Multi-Scale Fusion Network for Real-Time Deepfake Detection [6.875468802805521]
本稿では,リアルタイムディープフェイク検出のための軽量で効果的なアーキテクチャを提案する。
空間テクスチャと周波数アーティファクトを併用した空間周波数ハイブリッド認識モジュールを設計する。
いくつかのベンチマークデータセットの実験では、SFMFNetは精度と効率のバランスを良好に達成し、リアルタイムアプリケーションに対して強力な一般化と実用的な価値を達成している。
論文 参考訳(メタデータ) (2025-08-28T05:55:28Z) - Spatiotemporal Attention-based Semantic Compression for Real-time Video
Recognition [117.98023585449808]
本稿では,各フレームにおけるフレームと画素の重要性を評価するために,時間的注意に基づくオートエンコーダ(STAE)アーキテクチャを提案する。
我々は3D-2D CNNを組み合わせた軽量デコーダを開発し、欠落した情報を再構成する。
実験の結果,VT_STAEはビデオデータセットH51を,5%の精度で104倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2023-05-22T07:47:27Z) - Optical flow estimation from event-based cameras and spiking neural
networks [0.4899818550820575]
イベントベースセンサーはスパイキングニューラルネットワーク(SNN)に最適である
教師付きトレーニング後,高密度光フロー推定が可能なU-NetライクなSNNを提案する。
分離可能な畳み込みにより、我々は、合理的に正確な光フロー推定が得られる光モデルを開発することができた。
論文 参考訳(メタデータ) (2023-02-13T16:17:54Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern
Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。
文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。
フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。
LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文 参考訳(メタデータ) (2022-05-30T14:30:45Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。