論文の概要: Low-latency hand gesture recognition with a low resolution thermal
imager
- arxiv url: http://arxiv.org/abs/2004.11623v1
- Date: Fri, 24 Apr 2020 09:43:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 03:53:08.379362
- Title: Low-latency hand gesture recognition with a low resolution thermal
imager
- Title(参考訳): 低分解能熱画像を用いた低遅延ハンドジェスチャ認識
- Authors: Maarten Vandersteegen, Wouter Reusen, Kristof Van Beeck Toon Goedeme
- Abstract要約: 我々は,32×24ピクセルの安価な低解像度熱カメラを用いて手の動きを予測するアルゴリズムを提案する。
我々の最良のモデルは95.9%の分類精度と83%のmAP検出精度を達成し、その処理パイプラインは1フレームのレイテンシしか持たない。
- 参考スコア(独自算出の注目度): 4.063682271487617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Using hand gestures to answer a call or to control the radio while driving a
car, is nowadays an established feature in more expensive cars. High resolution
time-of-flight cameras and powerful embedded processors usually form the heart
of these gesture recognition systems. This however comes with a price tag. We
therefore investigate the possibility to design an algorithm that predicts hand
gestures using a cheap low-resolution thermal camera with only 32x24 pixels,
which is light-weight enough to run on a low-cost processor. We recorded a new
dataset of over 1300 video clips for training and evaluation and propose a
light-weight low-latency prediction algorithm. Our best model achieves 95.9%
classification accuracy and 83% mAP detection accuracy while its processing
pipeline has a latency of only one frame.
- Abstract(参考訳): 自動車の運転中に電話に応答したり、ラジオを制御したりする手振りは、近年は高価な車に定着した機能となっている。
高解像度の飛行時間カメラと強力な組み込みプロセッサは、通常これらのジェスチャー認識システムの中心となる。
しかし、これは価格タグがついている。
そこで我々は,32×24ピクセルの安価な低解像度熱カメラを用いて手の動きを予測するアルゴリズムを設計する可能性を検討する。
トレーニングと評価のための1300以上のビデオクリップのデータセットを新たに記録し,軽量低レイテンシ予測アルゴリズムを提案する。
我々の最良のモデルは95.9%の分類精度と83%のmAP検出精度を達成し、その処理パイプラインは1フレームのレイテンシしか持たない。
関連論文リスト
- Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Resource-Efficient Gesture Recognition using Low-Resolution Thermal
Camera via Spiking Neural Networks and Sparse Segmentation [1.7758299835471887]
本研究は,安価で低解像度(24×32)熱センサを用いた手動作認識のための新しいアプローチを提案する。
標準のRGBカメラと比較して、提案システムは照明のバリエーションに敏感である。
本稿では,最近提案されたモノスタブル・マルチバイブレータ(MMV)ニューラルネットワークを新しいSNNのクラスとして革新的に利用することで,メモリと計算の複雑さが1桁以上小さくなることを示す。
論文 参考訳(メタデータ) (2024-01-12T13:20:01Z) - EventTransAct: A video transformer-based framework for Event-camera
based action recognition [52.537021302246664]
イベントカメラは、RGBビデオの標準アクション認識と比較して、新しい機会を提供する。
本研究では,最初にイベントフレーム当たりの空間埋め込みを取得するビデオトランスフォーマーネットワーク(VTN)という,計算効率のよいモデルを用いる。
イベントデータのスパースできめ細かい性質にVTNをよりよく採用するために、イベントコントラストロス(mathcalL_EC$)とイベント固有の拡張を設計する。
論文 参考訳(メタデータ) (2023-08-25T23:51:07Z) - Agile gesture recognition for capacitive sensing devices: adapting
on-the-job [55.40855017016652]
本システムでは, コンデンサセンサからの信号を手の動き認識器に組み込んだ手動作認識システムを提案する。
コントローラは、着用者5本の指それぞれからリアルタイム信号を生成する。
機械学習技術を用いて時系列信号を解析し,500ms以内で5本の指を表現できる3つの特徴を同定する。
論文 参考訳(メタデータ) (2023-05-12T17:24:02Z) - PMI Sampler: Patch Similarity Guided Frame Selection for Aerial Action
Recognition [52.78234467516168]
本稿では、隣接フレーム間の動きバイアスを定量化するために、パッチ相互情報(PMI)スコアの概念を導入する。
シフトリークReLuと累積分布関数を用いた適応フレーム選択方式を提案する。
本手法は,UAV-Humanの2.2~13.8%,NEC Droneの6.8%,Diving48データセットの9.0%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2023-04-14T00:01:11Z) - Person Detection Using an Ultra Low-resolution Thermal Imager on a
Low-cost MCU [5.684789481921423]
低コスト32x24ピクセルの静止画像から熱映像を処理する超軽量CNN人体検出器を提案する。
我々のモデルは最大91.62%の精度(F1スコア)を実現し、10k未満のパラメータを持ち、低コストマイクロコントローラ上で87msと46msの速度で動作します。
論文 参考訳(メタデータ) (2022-12-16T11:27:50Z) - Hand gesture recognition using 802.11ad mmWave sensor in the mobile
device [2.5476515662939563]
スマートフォンにおける802.11ad 60GHz (mmWave) 技術を用いたAI支援手振り認識の実現可能性について検討する。
我々は、時間分割デュプレックス(TDD)によってレーダーセンシングと通信波形が共存できるプロトタイプシステムを構築した。
センシングデータを収集し、100ミリ秒以内にジェスチャーを予測する。
論文 参考訳(メタデータ) (2022-11-14T03:36:17Z) - ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。
我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。
ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-05-14T21:16:21Z) - Fast and Accurate Camera Scene Detection on Smartphones [51.424407411660376]
本稿では,11K以上の手動クロール画像を含むカメラシーン検出データセット(CamSDD)を提案する。
本研究では,このデータセット上で上位3の99.5%の精度を示す,効率的かつNPU対応のCNNモデルを提案する。
論文 参考訳(メタデータ) (2021-05-17T14:06:21Z) - FrameExit: Conditional Early Exiting for Efficient Video Recognition [11.92976432364216]
効率的なビデオ認識のための条件付き早期終了フレームワークを提案する。
私たちのモデルは、単純なビデオのフレーム数を減らし、複雑なビデオのフレーム数を増やすことを学びます。
提案手法は,HVUベンチマーク上での効率的な映像理解のための新しい手法である。
論文 参考訳(メタデータ) (2021-04-27T18:01:05Z) - KutralNet: A Portable Deep Learning Model for Fire Recognition [4.886882441164088]
火災認識のための浮動小数点演算(浮動小数点演算)の少ない新しいディープラーニングアーキテクチャを提案する。
また, 火災認識のための携帯型手法と, モデル計算コスト削減のための近代技術の利用を提案する。
私たちのモデルの1つは、FireNetよりも71%少ないパラメータを示しながら、競争精度とAUROCのパフォーマンスを示しています。
論文 参考訳(メタデータ) (2020-08-16T09:35:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。