論文の概要: Person Detection Using an Ultra Low-resolution Thermal Imager on a
Low-cost MCU
- arxiv url: http://arxiv.org/abs/2212.08415v1
- Date: Fri, 16 Dec 2022 11:27:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 14:44:30.937573
- Title: Person Detection Using an Ultra Low-resolution Thermal Imager on a
Low-cost MCU
- Title(参考訳): 低コストMCUを用いた超低分解能熱画像を用いた人物検出
- Authors: Maarten Vandersteegen, Wouter Reusen, Kristof Van Beeck, Toon
Goedem\'e
- Abstract要約: 低コスト32x24ピクセルの静止画像から熱映像を処理する超軽量CNN人体検出器を提案する。
我々のモデルは最大91.62%の精度(F1スコア)を実現し、10k未満のパラメータを持ち、低コストマイクロコントローラ上で87msと46msの速度で動作します。
- 参考スコア(独自算出の注目度): 5.684789481921423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting persons in images or video with neural networks is a well-studied
subject in literature. However, such works usually assume the availability of a
camera of decent resolution and a high-performance processor or GPU to run the
detection algorithm, which significantly increases the cost of a complete
detection system. However, many applications require low-cost solutions,
composed of cheap sensors and simple microcontrollers. In this paper, we
demonstrate that even on such hardware we are not condemned to simple classic
image processing techniques. We propose a novel ultra-lightweight CNN-based
person detector that processes thermal video from a low-cost 32x24 pixel static
imager. Trained and compressed on our own recorded dataset, our model achieves
up to 91.62% accuracy (F1-score), has less than 10k parameters, and runs as
fast as 87ms and 46ms on low-cost microcontrollers STM32F407 and STM32F746,
respectively.
- Abstract(参考訳): 画像やビデオ中の人物をニューラルネットワークで検出することは、文学においてよく研究されている課題である。
しかし、そのような作業は通常、十分な解像度のカメラと、検出アルゴリズムを実行するための高性能プロセッサまたはGPUが利用可能であると仮定し、完全な検出システムのコストを大幅に高める。
しかし、多くのアプリケーションは安価なセンサーとシンプルなマイクロコントローラからなる低コストのソリューションを必要としている。
本稿では,そのようなハードウェア上でも,従来の単純な画像処理技術に批判されないことを示す。
低コスト32x24ピクセルの静止画像から熱映像を処理する超軽量CNN人体検出器を提案する。
私たちの記録したデータセットでトレーニングと圧縮を行い、このモデルは最大91.62%の精度(f1-score)を達成し、10k未満のパラメータを持ち、低コストのマイクロコントローラstm32f407とstm32f746上でそれぞれ87msと46msの速度で動作します。
関連論文リスト
- Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget [53.311109531586844]
大規模T2I拡散変圧器モデルの低コスト化を実証する。
我々は16億のパラメータスパーストランスをわずか1890ドルの経済的コストで訓練し、ゼロショット世代で12.7 FIDを達成する。
我々は、マイクロ予算での大規模拡散モデルのトレーニングをさらに民主化するために、エンドツーエンドのトレーニングパイプラインをリリースすることを目指している。
論文 参考訳(メタデータ) (2024-07-22T17:23:28Z) - Resource-Efficient Gesture Recognition using Low-Resolution Thermal
Camera via Spiking Neural Networks and Sparse Segmentation [1.7758299835471887]
本研究は,安価で低解像度(24×32)熱センサを用いた手動作認識のための新しいアプローチを提案する。
標準のRGBカメラと比較して、提案システムは照明のバリエーションに敏感である。
本稿では,最近提案されたモノスタブル・マルチバイブレータ(MMV)ニューラルネットワークを新しいSNNのクラスとして革新的に利用することで,メモリと計算の複雑さが1桁以上小さくなることを示す。
論文 参考訳(メタデータ) (2024-01-12T13:20:01Z) - Practical cross-sensor color constancy using a dual-mapping strategy [0.0]
提案手法では,D65条件下では,テストセンサからの単純な白点のみを必要とする。
第2のマッピングフェーズでは、再構成された画像データをスパースに変換し、軽量な多層パーセプトロン(MLP)モデルで最適化する。
このアプローチは、センサの相違を効果的に低減し、主要なクロスセンサー手法と同等の性能を提供する。
論文 参考訳(メタデータ) (2023-11-20T13:58:59Z) - Privacy-Preserving Person Detection Using Low-Resolution Infrared
Cameras [9.801893730708134]
インテリジェントな建物の管理においては,照明,換気,暖房の効率向上,コスト削減,快適性向上のために,部屋内の人数や場所を知ることが重要である。
これは典型的には、部屋の天井に設置され、各人の身元を隠蔽する低解像度赤外線カメラを統合する組み込みデバイスを用いて人々を検知することで達成される。
正確な検出のためには、最先端のディープラーニングモデルは、大きな注釈付き画像データセットを使用して教師付きトレーニングを必要とする。
本稿では,低分解能赤外線画像に基づく人物検出に適したコスト効率の手法について検討する。
論文 参考訳(メタデータ) (2022-09-22T22:20:30Z) - ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。
我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。
ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-05-14T21:16:21Z) - Privacy-preserving Social Distance Monitoring on Microcontrollers with
Low-Resolution Infrared Sensors and CNNs [10.80166668204102]
低解像度赤外線アレイセンサーは、光学カメラやスマートフォン/ウェアラブルに代わり、低コスト、低消費電力、プライバシー保護を提供する。
小型畳み込みニューラルネットワーク(CNN)を用いた8x8 IRアレイセンサの生出力を精度良く検出できることを実証した。
我々は,最も優れたCNNが86.3%のバランスの取れた精度を達成し,最先端の決定論的アルゴリズムによって達成された61%を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2022-04-22T07:17:45Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - Real-Time Resource Allocation for Tracking Systems [54.802447204921634]
本稿では,人物検出装置を画像の関連部分にのみ適用することにより,コストを大幅に削減するEmphPartiMaxというアルゴリズムを提案する。
PartiMaxは、イメージ内の$n$候補のEmphpixelボックスの$k$を選択するために、パーティクルフィルタの情報を利用する。
本システムでは,画像中のピクセルボックスの10%しか処理しないが,すべてのピクセルボックスを処理する場合,元のトラッキング性能の80%を維持している。
論文 参考訳(メタデータ) (2020-09-21T08:29:05Z) - Low-latency hand gesture recognition with a low resolution thermal
imager [4.063682271487617]
我々は,32×24ピクセルの安価な低解像度熱カメラを用いて手の動きを予測するアルゴリズムを提案する。
我々の最良のモデルは95.9%の分類精度と83%のmAP検出精度を達成し、その処理パイプラインは1フレームのレイテンシしか持たない。
論文 参考訳(メタデータ) (2020-04-24T09:43:48Z) - Near-chip Dynamic Vision Filtering for Low-Bandwidth Pedestrian
Detection [99.94079901071163]
本稿では、ダイナミックビジョンセンサ(DVS)を用いた歩行者検出のための新しいエンドツーエンドシステムを提案する。
我々は、複数のセンサがローカル処理ユニットにデータを送信し、検出アルゴリズムを実行するアプリケーションをターゲットにしている。
我々の検出器は450ミリ秒毎に検出を行うことができ、総合的なテストF1スコアは83%である。
論文 参考訳(メタデータ) (2020-04-03T17:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。