論文の概要: Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems
- arxiv url: http://arxiv.org/abs/2404.11488v1
- Date: Wed, 17 Apr 2024 15:45:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 13:25:44.189353
- Title: Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems
- Title(参考訳): 超低消費電力組込みシステムにおけるビデオ物体検出のための多分解能Rescored ByteTrack
- Authors: Luca Bompani, Manuele Rusci, Daniele Palossi, Francesco Conti, Luca Benini,
- Abstract要約: Multi-Resolution Rescored Byte-Track (MR2-ByteTrack)は、超低消費電力組み込みプロセッサのための新しいビデオオブジェクト検出フレームワークである。
MR2-ByteTrackは、市販のDeep Neural Networkベースのオブジェクト検出器の平均計算負荷を最大2.25$times$に削減する。
GAP9マイクロコントローラでは,平均精度が2.16%,遅延が43%向上した。
- 参考スコア(独自算出の注目度): 13.225654514930595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces Multi-Resolution Rescored Byte-Track (MR2-ByteTrack), a novel video object detection framework for ultra-low-power embedded processors. This method reduces the average compute load of an off-the-shelf Deep Neural Network (DNN) based object detector by up to 2.25$\times$ by alternating the processing of high-resolution images (320$\times$320 pixels) with multiple down-sized frames (192$\times$192 pixels). To tackle the accuracy degradation due to the reduced image input size, MR2-ByteTrack correlates the output detections over time using the ByteTrack tracker and corrects potential misclassification using a novel probabilistic Rescore algorithm. By interleaving two down-sized images for every high-resolution one as the input of different state-of-the-art DNN object detectors with our MR2-ByteTrack, we demonstrate an average accuracy increase of 2.16% and a latency reduction of 43% on the GAP9 microcontroller compared to a baseline frame-by-frame inference scheme using exclusively full-resolution images. Code available at: https://github.com/Bomps4/Multi_Resolution_Rescored_ByteTrack
- Abstract(参考訳): 本稿では,超低消費電力組み込みプロセッサのための新しいビデオオブジェクト検出フレームワークであるMulti-Resolution Rescored Byte-Track(MR2-ByteTrack)を紹介する。
この方法は、複数のダウンサイズのフレーム(192$\times$192ピクセル)で高解像度画像(320$\times$320ピクセル)の処理を交互にすることで、オフザシェルディープニューラルネットワーク(DNN)ベースのオブジェクト検出器の平均計算負荷を最大2.25$\times$に削減する。
MR2-ByteTrackは、画像入力サイズの削減による精度劣化に対処するため、ByteTrackトラッカーを用いて出力検出を時間とともに相関させ、新しい確率的Rescoreアルゴリズムを用いて潜在的な誤分類を修正する。
MR2-ByteTrackと異なる最先端のDNNオブジェクト検出器の入力として,高解像度で2つのダウンサイズ画像をインターリーブすることにより,GAP9マイクロコントローラにおける平均精度2.16%,遅延低減率43%を,フル解像度画像のみを用いたベースラインフレーム・バイ・フレーム推論方式と比較して示す。
https://github.com/Bomps4/Multi_Resolution_Rescored_ByteTrack
関連論文リスト
- Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - LoReTrack: Efficient and Accurate Low-Resolution Transformer Tracking [12.670730236928353]
低分解能トランストラッカー(LoReTrack)
256x256解像度のLoReTrackは、同じ解像度のベースラインを一貫して改善し、384x384高解像度のTransformerトラッカーと比較して、競争力またはさらに良い結果を示す。
128x128の解像度で、LaSOT/LaSOTextで64.9%/46.4%のSUCスコアを持つCPU上で25fpsで動作する。
論文 参考訳(メタデータ) (2024-05-27T21:19:04Z) - Simplifying Two-Stage Detectors for On-Device Inference in Remote Sensing [0.7305342793164903]
本研究では,2段階物体検出器のモデル簡易化手法を提案する。
本手法は,DOTAv1.5データセットの2.1%以内の精度で計算コストを61.2%まで削減する。
論文 参考訳(メタデータ) (2024-04-11T00:45:10Z) - Practical cross-sensor color constancy using a dual-mapping strategy [0.0]
提案手法では,D65条件下では,テストセンサからの単純な白点のみを必要とする。
第2のマッピングフェーズでは、再構成された画像データをスパースに変換し、軽量な多層パーセプトロン(MLP)モデルで最適化する。
このアプローチは、センサの相違を効果的に低減し、主要なクロスセンサー手法と同等の性能を提供する。
論文 参考訳(メタデータ) (2023-11-20T13:58:59Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - DPNET: Dual-Path Network for Efficient Object Detectioj with Lightweight
Self-Attention [16.13989397708127]
DPNetは、軽量な自己注意を伴う効率的なオブジェクト検出のためのデュアルパスネットワークである。
COCOデータセットでは29.0%のAPを達成し、320x320の画像に対して1.14 GFLOPと2.27Mモデルサイズしか達成していない。
論文 参考訳(メタデータ) (2021-10-31T13:38:16Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - PV-RCNN++: Point-Voxel Feature Set Abstraction With Local Vector
Representation for 3D Object Detection [100.60209139039472]
点雲からの正確な3次元検出を行うために,PointVoxel Region based Convolution Neural Networks (PVRCNNs)を提案する。
提案するPV-RCNNは,Openデータセットと高競争性KITTIベンチマークの両方において,従来の最先端3D検出方法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2021-01-31T14:51:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。