論文の概要: Real-Time Activity Recognition and Intention Recognition Using a
Vision-based Embedded System
- arxiv url: http://arxiv.org/abs/2107.12744v1
- Date: Tue, 27 Jul 2021 11:38:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 14:39:53.150555
- Title: Real-Time Activity Recognition and Intention Recognition Using a
Vision-based Embedded System
- Title(参考訳): ビジョンベース埋め込みシステムを用いたリアルタイム活動認識と意図認識
- Authors: Sahar Darafsh, Saeed Shiry Ghidary, Morteza Saheb Zamani
- Abstract要約: ドアを通そうとしないという人々の意図を認識するために,リアルタイムな活動認識を導入する。
このシステムは、エレベーターや自動ドアに適用すれば、省エネと効率の向上につながる。
組込みシステムは、意図認識データセットの98.78%の精度で実装された。
- 参考スコア(独自算出の注目度): 4.060731229044571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid increase in digital technologies, most fields of study include
recognition of human activity and intention recognition, which are important in
smart environments. In this research, we introduce a real-time activity
recognition to recognize people's intentions to pass or not pass a door. This
system, if applied in elevators and automatic doors will save energy and
increase efficiency. For this study, data preparation is applied to combine the
spatial and temporal features with the help of digital image processing
principles. Nevertheless, unlike previous studies, only one AlexNet neural
network is used instead of two-stream convolutional neural networks. Our
embedded system was implemented with an accuracy of 98.78% on our Intention
Recognition dataset. We also examined our data representation approach on other
datasets, including HMDB-51, KTH, and Weizmann, and obtained accuracy of
78.48%, 97.95%, and 100%, respectively. The image recognition and neural
network models were simulated and implemented using Xilinx simulators for
ZCU102 board. The operating frequency of this embedded system is 333 MHz, and
it works in real-time with 120 frames per second (fps).
- Abstract(参考訳): デジタル技術の急速な増加に伴い、ほとんどの研究分野は、スマート環境において重要なヒューマンアクティビティの認識と意図認識を含む。
本研究では,ドアを通そうとしないという人々の意図をリアルタイムに認識する活動認識システムを提案する。
このシステムはエレベーターや自動ドアに適用すれば、省エネと効率の向上につながる。
本研究では,デジタル画像処理の原理を用いて,空間的特徴と時間的特徴を組み合わせたデータ準備を行う。
それにもかかわらず、以前の研究とは異なり、2ストリーム畳み込みニューラルネットワークの代わりに1つのAlexNetニューラルネットワークのみが使用される。
組み込みシステムは意図認識データセット上で98.78%の精度で実装した。
また、HMDB-51、KTH、Weizmannを含む他のデータセットに対するデータ表現アプローチも検討し、それぞれ78.48%、97.95%、100%の精度を得た。
画像認識とニューラルネットワークモデルはzcu102ボード用のxilinxシミュレータを用いてシミュレーションおよび実装された。
この組み込みシステムの動作周波数は333mhzで、毎秒120フレーム(fps)でリアルタイムに動作します。
関連論文リスト
- Active Dendrites Enable Efficient Continual Learning in Time-To-First-Spike Neural Networks [1.7333836118546833]
活性デンドライトで強化された新しいスパイキングニューラルネットワークモデルを提案する。
我々のモデルは、時間的に符号化されたSNNにおいて破滅的な忘れを効果的に軽減することができる。
エッジデバイスにおける現実的なデプロイメントを実現するための,新たなディジタルハードウェアアーキテクチャを提供する。
論文 参考訳(メタデータ) (2024-04-30T10:11:03Z) - Agile gesture recognition for capacitive sensing devices: adapting
on-the-job [55.40855017016652]
本システムでは, コンデンサセンサからの信号を手の動き認識器に組み込んだ手動作認識システムを提案する。
コントローラは、着用者5本の指それぞれからリアルタイム信号を生成する。
機械学習技術を用いて時系列信号を解析し,500ms以内で5本の指を表現できる3つの特徴を同定する。
論文 参考訳(メタデータ) (2023-05-12T17:24:02Z) - Differentiable Frequency-based Disentanglement for Aerial Video Action
Recognition [56.91538445510214]
ビデオにおける人間の行動認識のための学習アルゴリズムを提案する。
我々のアプローチは、主に斜めに配置されたダイナミックカメラから取得されるUAVビデオのために設計されている。
我々はUAV HumanデータセットとNEC Droneデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-09-15T22:16:52Z) - Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern
Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。
文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。
フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。
LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文 参考訳(メタデータ) (2022-05-30T14:30:45Z) - Towards Domain-Independent and Real-Time Gesture Recognition Using
mmWave Signal [11.76969975145963]
DI-Gesture はドメインに依存しないリアルタイムの mmWave ジェスチャー認識システムである。
リアルタイムシナリオでは、DI-Gesutreの精度は平均推定時間2.87msで97%以上に達する。
論文 参考訳(メタデータ) (2021-11-11T13:28:28Z) - EfficientTDNN: Efficient Architecture Search for Speaker Recognition in
the Wild [29.59228560095565]
認識精度を維持しつつ、推論効率を向上させるために、ニューラルネットワーク探索に基づく効率的な時間遅延ニューラルネットワーク(EfficientTDNN)を提案する。
VoxCelebデータセットの実験では、EfficientTDNNは約1013$sの巨大な検索スペースを提供し、1.66%のEERと0.156のDCF$_0.01$と565MMACを達成している。
論文 参考訳(メタデータ) (2021-03-25T03:28:07Z) - A Spike Learning System for Event-driven Object Recognition [8.875351982997554]
LiDARやダイナミックビジョンセンサー(DVS)などのイベント駆動センサは、高解像度および高速アプリケーションで注目を集めています。
本稿では,スパイキングニューラルネットワーク(SNN)を用いたスパイキング学習システムを提案する。
論文 参考訳(メタデータ) (2021-01-21T20:57:53Z) - Identity-Aware Attribute Recognition via Real-Time Distributed Inference
in Mobile Edge Clouds [53.07042574352251]
我々は、MEC対応カメラ監視システムにおいて、re-IDを用いた歩行者属性認識のための新しいモデルの設計を行う。
本稿では,属性認識と人物再IDを協調的に考慮し,分散モジュールの集合を持つ新しい推論フレームワークを提案する。
そこで我々は,提案した分散推論フレームワークのモジュール分布の学習に基づくアルゴリズムを考案した。
論文 参考訳(メタデータ) (2020-08-12T12:03:27Z) - Exploiting the ConvLSTM: Human Action Recognition using Raw Depth
Video-Based Recurrent Neural Networks [0.0]
本稿では,畳み込み長短期記憶ユニット,すなわちConvLSTMに基づく2つのニューラルネットワークを提案し,比較する。
提案モデルは,最先端手法と比較して,計算コストの低い競合認識精度を実現する。
論文 参考訳(メタデータ) (2020-06-13T23:35:59Z) - Continuous Emotion Recognition via Deep Convolutional Autoencoder and
Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。
ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。
表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-01-31T17:47:16Z) - Temporal Pulses Driven Spiking Neural Network for Fast Object
Recognition in Autonomous Driving [65.36115045035903]
スパイキングニューラルネットワーク(SNN)を用いた生時間パルスで直接物体認識問題に対処する手法を提案する。
各種データセットを用いて評価した結果,提案手法は最先端の手法に匹敵する性能を示しながら,優れた時間効率を実現している。
論文 参考訳(メタデータ) (2020-01-24T22:58:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。