論文の概要: TinyRadarNN: Combining Spatial and Temporal Convolutional Neural
Networks for Embedded Gesture Recognition with Short Range Radars
- arxiv url: http://arxiv.org/abs/2006.16281v3
- Date: Tue, 16 Mar 2021 15:33:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 04:41:14.859168
- Title: TinyRadarNN: Combining Spatial and Temporal Convolutional Neural
Networks for Embedded Gesture Recognition with Short Range Radars
- Title(参考訳): TinyRadarNN:短距離レーダを用いた埋め込みジェスチャー認識のための空間的・時間的畳み込みニューラルネットワークの組み合わせ
- Authors: Moritz Scherer, Michele Magno, Jonas Erb, Philipp Mayer, Manuel
Eggimann, Luca Benini
- Abstract要約: 本研究は,バッテリ操作型ウェアラブルデバイスを対象とした,低消費電力な組込み手位置認識アルゴリズムを提案する。
範囲周波数ドップラー特徴を用いた2次元畳み込みニューラルネットワーク(CNN)と時間列予測のための時間畳み込みニューラルネットワーク(TCN)を組み合わせる。
- 参考スコア(独自算出の注目度): 13.266626571886354
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This work proposes a low-power high-accuracy embedded hand-gesture
recognition algorithm targeting battery-operated wearable devices using low
power short-range RADAR sensors. A 2D Convolutional Neural Network (CNN) using
range frequency Doppler features is combined with a Temporal Convolutional
Neural Network (TCN) for time sequence prediction. The final algorithm has a
model size of only 46 thousand parameters, yielding a memory footprint of only
92 KB. Two datasets containing 11 challenging hand gestures performed by 26
different people have been recorded containing a total of 20,210 gesture
instances. On the 11 hand gesture dataset, accuracies of 86.6% (26 users) and
92.4% (single user) have been achieved, which are comparable to the
state-of-the-art, which achieves 87% (10 users) and 94% (single user), while
using a TCN-based network that is 7500x smaller than the state-of-the-art.
Furthermore, the gesture recognition classifier has been implemented on a
Parallel Ultra-Low Power Processor, demonstrating that real-time prediction is
feasible with only 21 mW of power consumption for the full TCN sequence
prediction network, while a system-level power consumption of less than 100 mW
is achieved. We provide open-source access to all the code and data collected
and used in this work on tinyradar.ethz.ch.
- Abstract(参考訳): 本研究は,低消費電力短距離RADARセンサを用いた電池駆動ウェアラブルデバイスを対象とした,低消費電力な組込み手位置認識アルゴリズムを提案する。
範囲周波数ドップラー特徴を用いた2次元畳み込みニューラルネットワーク(CNN)と時間列予測のための時間畳み込みニューラルネットワーク(TCN)を組み合わせる。
最終アルゴリズムのモデルサイズはわずか46万パラメータで、メモリフットプリントはわずか92kbである。
26人の異なる人物による11の挑戦的な手のジェスチャーを含む2つのデータセットが、合計20,210のジェスチャーインスタンスを含む記録されている。
11のジェスチャーデータセットでは、86.6%(26人)と92.4%(1人)のアキュラシーが達成され、最先端のユーザに比べて7500倍小さいTCNベースのネットワークを使用して87%(10人)と94%(1人)を達成した。
さらに、このジェスチャー認識分類器を並列超低消費電力プロセッサに実装し、フルTNシーケンス予測ネットワークにおいて、リアルタイム予測が21mWの消費電力で実現可能であるとともに、システムレベルの消費電力が100mW未満であることを示す。
当社は、tinyradar.ethz.chのこの作業で収集および使用されたすべてのコードとデータに対するオープンソースアクセスを提供します。
関連論文リスト
- TENNs-PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [1.1970409518725493]
低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
我々は3つのイベントベースのベンチマークを実験し、メモリと計算コストを大幅に削減した大きなマージンで3つすべてに対して最先端の結果を得た。
論文 参考訳(メタデータ) (2024-05-20T17:06:24Z) - Gesture Recognition for FMCW Radar on the Edge [0.0]
ジェスチャーは5つの特徴の集合によって効率的に特徴付けられることを示す。
リカレントニューラルネットワーク(RNN)ベースのアーキテクチャは、これらの特徴を利用して、5つの異なるジェスチャーを共同で検出し、分類する。
提案システムでは, ホールドアウトテストデータセットにおいて, 98.4%のF1スコアでジェスチャーを認識する。
論文 参考訳(メタデータ) (2023-10-13T06:03:07Z) - Ultra-low Power Deep Learning-based Monocular Relative Localization
Onboard Nano-quadrotors [64.68349896377629]
この研究は、2つのピアナノドロンのディープニューラルネットワーク(DNN)を介して、単分子の相対的な局所化に対処する、新しい自律的なエンドツーエンドシステムを示す。
超制約ナノドローンプラットフォームに対処するため,データセットの増大,量子化,システム最適化などを含む垂直統合フレームワークを提案する。
実験の結果,DNNは低分解能モノクローム画像のみを用いて最大2mの距離で10cmのターゲットナノドローンを正確に局在させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-03T14:14:08Z) - Hand gesture recognition using 802.11ad mmWave sensor in the mobile
device [2.5476515662939563]
スマートフォンにおける802.11ad 60GHz (mmWave) 技術を用いたAI支援手振り認識の実現可能性について検討する。
我々は、時間分割デュプレックス(TDD)によってレーダーセンシングと通信波形が共存できるプロトタイプシステムを構築した。
センシングデータを収集し、100ミリ秒以内にジェスチャーを予測する。
論文 参考訳(メタデータ) (2022-11-14T03:36:17Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern
Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。
文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。
フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。
LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文 参考訳(メタデータ) (2022-05-30T14:30:45Z) - Real-time Speaker counting in a cocktail party scenario using
Attention-guided Convolutional Neural Network [60.99112031408449]
重なり合う音声におけるアクティブ話者数を推定するために,CNN(Real-time, Single-channel attention-guided Convolutional Neural Network)を提案する。
提案システムは,CNNモデルを用いて音声スペクトルから高レベル情報を抽出する。
WSJコーパスを用いた重畳音声のシミュレーション実験により,従来の時間平均プーリングに比べて,注意解がほぼ3%向上することが示されている。
論文 参考訳(メタデータ) (2021-10-30T19:24:57Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Sound Event Detection with Binary Neural Networks on Tightly
Power-Constrained IoT Devices [20.349809458335532]
サウンドイベント検出(SED)は、消費者およびスマートシティアプリケーションのホットトピックです。
Deep Neural Networksに基づく既存のアプローチは非常に効果的ですが、メモリ、電力、スループットの面で非常に要求が高いです。
本稿では,高エネルギー効率なRISC-V(8+1)コアGAP8マイクロコントローラと,極端量子化と小プリントバイナリニューラルネットワーク(BNN)の組み合わせについて検討する。
論文 参考訳(メタデータ) (2021-01-12T12:38:23Z) - Resource-efficient DNNs for Keyword Spotting using Neural Architecture
Search and Quantization [23.850887499271842]
本稿では,キーワードスポッティングのための小さなモデルの自動発見のためのニューラルアーキテクチャサーチ(NAS)を提案する。
nas法を用いて畳み込みニューラルネットワーク(cnns)の構造を最適化し,分類精度を最大化する。
NASのみを使用して、Google音声コマンドデータセットで95.4%の精度で高効率なモデルを得ることができた。
論文 参考訳(メタデータ) (2020-12-18T09:53:55Z) - End-to-End Multi-speaker Speech Recognition with Transformer [88.22355110349933]
音声認識モデルにおけるRNNベースのエンコーダデコーダをトランスフォーマーアーキテクチャに置き換える。
また、計算量を削減するために、シーケンス全体ではなくセグメントに制限されるセルフアテンションコンポーネントを変更します。
論文 参考訳(メタデータ) (2020-02-10T16:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。