論文の概要: A Novel Deep Hybrid Framework with Ensemble-Based Feature Optimization for Robust Real-Time Human Activity Recognition
- arxiv url: http://arxiv.org/abs/2508.18695v1
- Date: Tue, 26 Aug 2025 05:42:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.692434
- Title: A Novel Deep Hybrid Framework with Ensemble-Based Feature Optimization for Robust Real-Time Human Activity Recognition
- Title(参考訳): ロバストなリアルタイム人間活動認識のためのアンサンブルに基づく特徴最適化を用いた新しいディープハイブリッドフレームワーク
- Authors: Wasi Ullah, Yasir Noman Khalid, Saddam Hussain Khan,
- Abstract要約: HAR(Human Activity Recognition)は、スマート監視、ヘルスケア、アシスト技術、スポーツ分析など、さまざまなアプリケーションにおいて重要な役割を担っている。
カスタマイズされたInceptionV3、LSTMアーキテクチャ、新しいアンサンブルベースの特徴選択戦略を統合した、最適化されたハイブリッドディープラーニングフレームワークが導入された。
提案手法は、99.65%の認識精度を実現し、特徴を7まで減らし、推論時間を短縮する。
- 参考スコア(独自算出の注目度): 0.6991281327290525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human Activity Recognition (HAR) plays a pivotal role in various applications, including smart surveillance, healthcare, assistive technologies, sports analytics, etc. However, HAR systems still face critical challenges, including high computational costs, redundant features, and limited scalability in real-time scenarios. An optimized hybrid deep learning framework is introduced that integrates a customized InceptionV3, an LSTM architecture, and a novel ensemble-based feature selection strategy. The proposed framework first extracts spatial descriptors using the customized InceptionV3 model, which captures multilevel contextual patterns, region homogeneity, and fine-grained localization cues. The temporal dependencies across frames are then modeled using LSTMs to effectively encode motion dynamics. Finally, an ensemble-based genetic algorithm with Adaptive Dynamic Fitness Sharing and Attention (ADFSA) is employed to select a compact and optimized feature set by dynamically balancing objectives such as accuracy, redundancy, uniqueness, and complexity reduction. Consequently, the selected feature subsets, which are both diverse and discriminative, enable various lightweight machine learning classifiers to achieve accurate and robust HAR in heterogeneous environments. Experimental results on the robust UCF-YouTube dataset, which presents challenges such as occlusion, cluttered backgrounds, motion dynamics, and poor illumination, demonstrate good performance. The proposed approach achieves 99.65% recognition accuracy, reduces features to as few as 7, and enhances inference time. The lightweight and scalable nature of the HAR system supports real-time deployment on edge devices such as Raspberry Pi, enabling practical applications in intelligent, resource-aware environments, including public safety, assistive technology, and autonomous monitoring systems.
- Abstract(参考訳): HAR(Human Activity Recognition)は、スマート監視、ヘルスケア、アシスト技術、スポーツ分析など、さまざまなアプリケーションにおいて重要な役割を担っている。
しかし、HARシステムは高い計算コスト、冗長な特徴、リアルタイムシナリオでのスケーラビリティの制限など、依然として重要な課題に直面している。
カスタマイズされたInceptionV3、LSTMアーキテクチャ、新しいアンサンブルベースの特徴選択戦略を統合した、最適化されたハイブリッドディープラーニングフレームワークが導入された。
提案フレームワークは、まず、マルチレベルコンテキストパターン、領域の均一性、きめ細かい局所化キューをキャプチャする、カスタマイズされたInceptionV3モデルを用いて空間記述子を抽出する。
フレーム間の時間的依存関係はLSTMを用いてモデル化され、モーションダイナミクスを効果的にエンコードする。
アダプティブ・ダイナミック・フィトネス・シェアリング・アンド・アテンション(Adaptive Dynamic Fitness Sharing and Attention, ADFSA)を用いたアンサンブルに基づく遺伝的アルゴリズムを用いて、精度、冗長性、特異性、複雑性の低減といった目的を動的にバランスさせることにより、コンパクトで最適化された特徴セットを選択する。
その結果、選択された特徴サブセットは多様かつ差別的であり、多様な軽量機械学習分類器が異種環境において正確で堅牢なHARを実現することができる。
UCF-YouTubeデータセットのロバストな結果から、閉塞、乱雑な背景、モーションダイナミクス、照明不足といった課題が、優れたパフォーマンスを示している。
提案手法は、99.65%の認識精度を実現し、特徴を7まで減らし、推論時間を短縮する。
HARシステムの軽量でスケーラブルな性質は、Raspberry Piなどのエッジデバイスへのリアルタイムデプロイメントをサポートし、公共の安全、補助技術、自律監視システムなど、インテリジェントでリソースを意識した環境における実践的なアプリケーションを可能にする。
関連論文リスト
- Scaling Test-Time Inference with Policy-Optimized, Dynamic Retrieval-Augmented Generation via KV Caching and Decoding [2.368662284133926]
本稿では,動的検索戦略と強化微調整により,RAG(Retrieval-Augmented Generation)システムを強化する枠組みを提案する。
我々のフレームワークは2つの補完手法を統合している: Policy-d Retrieval Augmented Generation (PORAG)とAdaptive Token-Layer Attention Scoring (ATLAS)。
我々のフレームワークは幻覚を減らし、ドメイン固有の推論を強化し、従来のRAGシステムよりも優れた効率とスケーラビリティを実現する。
論文 参考訳(メタデータ) (2025-04-02T01:16:10Z) - PER-DPP Sampling Framework and Its Application in Path Planning [5.158004370485019]
意思決定中心の強化学習フレームワークは、高度な制御システム研究で注目されている。
本研究では,強化学習体験再生機構におけるサンプル問題に対する方法論的改善を提案する。
多様性評価にDPP(Determinant Point Process)を導入することにより、適応的な選択プロトコルを備えた二重基準サンプリングフレームワークを開発する。
論文 参考訳(メタデータ) (2025-03-10T14:58:16Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。