論文の概要: Resource-Efficient Gesture Recognition using Low-Resolution Thermal
Camera via Spiking Neural Networks and Sparse Segmentation
- arxiv url: http://arxiv.org/abs/2401.06563v1
- Date: Fri, 12 Jan 2024 13:20:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 19:20:11.196008
- Title: Resource-Efficient Gesture Recognition using Low-Resolution Thermal
Camera via Spiking Neural Networks and Sparse Segmentation
- Title(参考訳): スパイクニューラルネットワークとスパースセグメンテーションによる低解像度熱カメラによる資源効率なジェスチャー認識
- Authors: Ali Safa, Wout Mommen, Lars Keuninckx
- Abstract要約: 本研究は,安価で低解像度(24×32)熱センサを用いた手動作認識のための新しいアプローチを提案する。
標準のRGBカメラと比較して、提案システムは照明のバリエーションに敏感である。
本稿では,最近提案されたモノスタブル・マルチバイブレータ(MMV)ニューラルネットワークを新しいSNNのクラスとして革新的に利用することで,メモリと計算の複雑さが1桁以上小さくなることを示す。
- 参考スコア(独自算出の注目度): 1.7758299835471887
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work proposes a novel approach for hand gesture recognition using an
inexpensive, low-resolution (24 x 32) thermal sensor processed by a Spiking
Neural Network (SNN) followed by Sparse Segmentation and feature-based gesture
classification via Robust Principal Component Analysis (R-PCA). Compared to the
use of standard RGB cameras, the proposed system is insensitive to lighting
variations while being significantly less expensive compared to high-frequency
radars, time-of-flight cameras and high-resolution thermal sensors previously
used in literature. Crucially, this paper shows that the innovative use of the
recently proposed Monostable Multivibrator (MMV) neural networks as a new class
of SNN achieves more than one order of magnitude smaller memory and compute
complexity compared to deep learning approaches, while reaching a top gesture
recognition accuracy of 93.9% using a 5-class thermal camera dataset acquired
in a car cabin, within an automotive context. Our dataset is released for
helping future research.
- Abstract(参考訳): 本研究では,安価で低解像度 (24 x 32) の熱センサをスパイキングニューラルネットワーク (snn) で処理し, スパースセグメンテーションとロバスト主成分分析 (r-pca) による特徴に基づくジェスチャ分類を行った。
標準のRGBカメラと比較して、提案システムは、従来文献で使われていた高周波数レーダー、飛行時間カメラ、高分解能熱センサーと比較してはるかに安価でありながら、光の変動に敏感である。
本稿では,最近提案されたsnnの新たなクラスとして,モノstable multivibrator(mmv)ニューラルネットワークを革新的に使用することで,車室内で取得した5つのサーマルカメラデータセットを用いて,最上位のジェスチャ認識精度を93.9%に到達しながら,深層学習手法に比べて1桁以上のメモリと計算複雑性を達成できることを示す。
私たちのデータセットは将来の研究を支援するためにリリースされています。
関連論文リスト
- Multi-Sensor Fusion for UAV Classification Based on Feature Maps of Image and Radar Data [4.392337343771302]
本稿では,すでに処理されているマルチセンサデータを新しいディープニューラルネットワークに融合させて,UAV検出のための分類精度を高めるシステムを提案する。
このモデルは、熱、光、レーダーデータに関連する個々の物体の検出と分類モデルから抽出された高レベル特徴を融合する。
論文 参考訳(メタデータ) (2024-10-21T15:12:37Z) - Semantic Segmentation of Radar Detections using Convolutions on Point
Clouds [59.45414406974091]
本稿では,レーダ検出を点雲に展開する深層学習手法を提案する。
このアルゴリズムは、距離依存クラスタリングと入力点雲の事前処理により、レーダ固有の特性に適応する。
我々のネットワークは、レーダポイント雲のセマンティックセグメンテーションのタスクにおいて、PointNet++に基づく最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-05-22T07:09:35Z) - Improved Static Hand Gesture Classification on Deep Convolutional Neural
Networks using Novel Sterile Training Technique [2.534406146337704]
非接触手ポーズと静的ジェスチャー認識は多くのアプリケーションで注目されている。
本稿では, ステレオ画像の導入により, 効率的なデータ収集手法と深部CNN訓練手法を提案する。
提案されたデータ収集とトレーニング手法を適用すると、静的ハンドジェスチャの分類率が85%から93%に向上する。
論文 参考訳(メタデータ) (2023-05-03T11:10:50Z) - Neural Architectural Nonlinear Pre-Processing for mmWave Radar-based
Human Gesture Perception [10.826849062116748]
本稿では,U-NetとEfficientNetという2つのディープラーニングモデルを用いて手の動きを検出し,ミリ波レーダ画像のノイズを除去する。
第1深層学習モデルステージに入る前に、画像の復号化を行うための新しい前処理手法により、分類の精度が向上する。
論文 参考訳(メタデータ) (2022-11-07T12:42:13Z) - Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern
Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。
文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。
フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。
LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文 参考訳(メタデータ) (2022-05-30T14:30:45Z) - Neural Architecture Search for Efficient Uncalibrated Deep Photometric
Stereo [105.05232615226602]
差別化可能なニューラルアーキテクチャサーチ(NAS)戦略を利用して、非校正型PSアーキテクチャを自動的に見つける。
DiLiGenTデータセットの実験では、自動検索されたニューラルネットワークのパフォーマンスが、最先端の未校正PSメソッドと好適に比較されている。
論文 参考訳(メタデータ) (2021-10-11T21:22:17Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - RAMP-CNN: A Novel Neural Network for Enhanced Automotive Radar Object
Recognition [10.006245521984697]
本稿では,オブジェクトの位置とクラスを抽出するマルチパースペクティブ・畳み込みニューラルネットワーク(RAMP-CNN)を提案する。
4次元畳み込みニューラルネットワーク(NN)の複雑さを回避するため、RAMP-CNNモデルにいくつかの低次元NNモデルを組み合わせることを提案する。
提案したRAMP-CNNモデルは、すべてのテストシナリオにおける以前の作業よりも平均リコールと平均精度が向上する。
論文 参考訳(メタデータ) (2020-11-13T19:12:12Z) - HyNNA: Improved Performance for Neuromorphic Vision Sensor based
Surveillance using Hybrid Neural Network Architecture [7.293414498855147]
領域提案のための形態素画像処理アルゴリズムを用いて,最近提案されたハイブリッドイベントフレームアプローチを改善した。
また、様々な畳み込みニューラルネットワーク(CNN)アーキテクチャを探索することにより、オブジェクト検出と分類の低消費電力要求にも対処する。
具体的には、対象検出フレームワークから得られた結果を最先端の低出力NVS監視システムと比較し、63.1%から82.16%の改善精度を示した。
論文 参考訳(メタデータ) (2020-03-19T07:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。