論文の概要: Multilevel neural networks with dual-stage feature fusion for human activity recognition
- arxiv url: http://arxiv.org/abs/2604.16577v1
- Date: Fri, 17 Apr 2026 13:08:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.084875
- Title: Multilevel neural networks with dual-stage feature fusion for human activity recognition
- Title(参考訳): デュアルステージ特徴融合を用いたマルチレベルニューラルネットワークによる人間の活動認識
- Authors: Abeer FathAllah Brery, Ascensión Gallardo-Antolín, Israel Gonzalez-Carrasco, Mahmoud Fakhry,
- Abstract要約: HAR(Human Activity Recognition)とは、センサから収集されたデータを用いて、人間の行動や活動を特定するプロセスである。
CNN、長期記憶(LSTM)ネットワーク、畳み込みLSTM、およびそれらのハイブリッドの組み合わせは、様々な研究領域において例外的な性能を示している。
本研究では,デュアルステージ機能融合を用いた2レベルネットワークアーキテクチャの新たなフレームワークについて検討する。
- 参考スコア(独自算出の注目度): 1.539942973115038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human activity recognition (HAR) refers to the process of identifying human actions and activities using data collected from sensors. Neural networks, such as convolutional neural networks (CNNs), long short-term memory (LSTM) networks, convolutional LSTM, and their hybrid combinations, have demonstrated exceptional performance in various research domains. Developing a multilevel individual or hybrid model for HAR involves strategically integrating multiple networks to capitalize on their complementary strengths. The structural arrangement of these components is a critical factor influencing the overall performance. This study explores a novel framework of a two-level network architecture with dual-stage feature fusion: late fusion, which combines the outputs from the first network level, and intermediate fusion, which integrates the features from both the first and second levels. We evaluated $15$ different network architectures of CNNs, LSTMs, and convolutional LSTMs, incorporating late fusion with and without intermediate fusion, to identify the optimal configuration. Experimental evaluation on two public benchmark datasets demonstrates that architectures incorporating both late and intermediate fusion achieve higher accuracy than those relying on late fusion alone. Moreover, the optimal configuration outperforms baseline models, thereby validating its effectiveness for HAR.
- Abstract(参考訳): HAR(Human Activity Recognition)とは、センサから収集されたデータを用いて、人間の行動や活動を特定するプロセスである。
畳み込みニューラルネットワーク(CNN)、長寿命メモリ(LSTM)ネットワーク、畳み込みLSTM、およびそれらのハイブリッド組み合わせなどのニューラルネットワークは、様々な研究領域において例外的な性能を示した。
HAR用のマルチレベル個別モデルやハイブリッドモデルを開発するには、複数のネットワークを戦略的に統合して、補完的な強みを生かす必要がある。
これらのコンポーネントの構造的配置は、全体的なパフォーマンスに影響を与える重要な要素である。
本研究では,第1次ネットワークレベルの出力を結合したレイトフュージョンと,第1次と第2次の両方の機能を統合する中間フュージョンという,2段階の機能融合を伴う2段階ネットワークアーキテクチャの新たな枠組みについて検討する。
我々は,CNN,LSTM,畳み込みLSTMのネットワークアーキテクチャを15ドルで評価した。
2つの公開ベンチマークデータセットに対する実験的評価は、後期核融合と中間核融合の両方を組み込んだアーキテクチャが後期核融合のみに依存するアーキテクチャよりも高い精度を実現することを示している。
さらに、最適構成はベースラインモデルよりも優れており、HARの有効性が検証される。
関連論文リスト
- Towards Sample Efficient Entanglement Classification for 3 and 4 Qubit Systems: A Tailored CNN-BiLSTM Approach [6.448866790627225]
畳み込みと双方向長短期記憶ネットワーク(CNN-BiLSTM)を統合したハイブリッドニューラルネットワークアーキテクチャを提案する。
この設計では、ローカルな特徴抽出にCNN、シーケンシャルな依存性モデリングにBiLSTMを活用し、最小限のトレーニングデータから堅牢な特徴学習を可能にする。
わずか100のサンプルでトレーニングされた場合、アーキテクチャ2は3ビットと4ビットの両方で90%を超える分類精度を維持し、数十のエポックで急速に失われることを示した。
論文 参考訳(メタデータ) (2026-01-30T04:59:44Z) - Research on a hybrid LSTM-CNN-Attention model for text-based web content classification [0.0]
本研究では,LSTMとCNNを統合したハイブリッドなディープラーニングアーキテクチャと,テキストに基づくWebコンテンツの分類を強化するアテンション機構を提案する。
提案アーキテクチャは、テキストベースのWebコンテンツ分類において、特に構文的特徴抽出と意味解釈の両方を必要とするタスクにおいて、高い効果を示す。
論文 参考訳(メタデータ) (2025-12-20T19:38:07Z) - SDS-Net: Shallow-Deep Synergism-detection Network for infrared small target detection [0.18641315013048293]
現在のCNNに基づく赤外小目標検出法は,浅部特徴と深部特徴の均一性を見落としている。
依存関係の関係と融合機構は、マルチレベル機能の相補性を十分に活用できない。
本稿では,マルチレベル特徴表現を効率的にモデル化する浅層深度相乗効果検出ネットワーク(SDS-Net)を提案する。
論文 参考訳(メタデータ) (2025-06-06T12:44:41Z) - BHViT: Binarized Hybrid Vision Transformer [53.38894971164072]
モデルバイナライゼーションは畳み込みニューラルネットワーク(CNN)のリアルタイムおよびエネルギー効率の計算を可能にした。
本稿では,バイナライズフレンドリーなハイブリッドViTアーキテクチャであるBHViTとそのバイナライズモデルを提案する。
提案アルゴリズムは,バイナリ ViT 手法間でSOTA 性能を実現する。
論文 参考訳(メタデータ) (2025-03-04T08:35:01Z) - Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングは、スパイキングニューラルネットワーク(SNN)を使用して推論タスクを実行する。
スパイクニューロン間で交換される各スパイクに小さなペイロードを埋め込むことで、エネルギー消費を増大させることなく推論精度を高めることができる。
分割コンピューティング — SNNを2つのデバイスに分割する — は、有望なソリューションだ。
本稿では,マルチレベルSNNを用いたニューロモルフィック無線分割コンピューティングアーキテクチャの総合的研究について述べる。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Bayesian Neural Network Language Modeling for Speech Recognition [59.681758762712754]
長期記憶リカレントニューラルネットワーク(LSTM-RNN)とトランスフォーマーで表される最先端のニューラルネットワーク言語モデル(NNLM)は非常に複雑になりつつある。
本稿では,LSTM-RNN と Transformer LM の基盤となる不確実性を考慮するために,ベイズ学習フレームワークの全体構造を提案する。
論文 参考訳(メタデータ) (2022-08-28T17:50:19Z) - Device Sampling for Heterogeneous Federated Learning: Theory,
Algorithms, and Implementation [24.084053136210027]
グラフシーケンシャル畳み込みネットワーク(GCN)に基づくサンプリング手法を開発した。
提案手法は,全機器の5%以下をサンプリングしながら,訓練されたモデル精度と必要なリソース利用の両面で,fedl(federated learning)を実質的に上回っている。
論文 参考訳(メタデータ) (2021-01-04T05:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。