論文の概要: Feature Compression for Rate Constrained Object Detection on the Edge
- arxiv url: http://arxiv.org/abs/2204.07314v1
- Date: Fri, 15 Apr 2022 03:39:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 12:52:34.166946
- Title: Feature Compression for Rate Constrained Object Detection on the Edge
- Title(参考訳): エッジ上の速度制約物体検出のための特徴圧縮
- Authors: Zhongzheng Yuan, Samyak Rawlekar, Siddharth Garg, Elza Erkip, Yao Wang
- Abstract要約: この問題を解決するための新たなアプローチは、ニューラルネットワークの計算をエッジサーバのコンピューティングリソースにオフロードすることだ。
本研究では、YOLOオブジェクト検出モデルの計算の一部をオフロードする「分割計算」システムについて検討する。
我々は、速度制約下でのオブジェクト検出精度を最適化するために、YOLOモデルとともに特徴圧縮および非圧縮モジュールを訓練する。
- 参考スコア(独自算出の注目度): 20.18227104333772
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in computer vision has led to a growth of interest in
deploying visual analytics model on mobile devices. However, most mobile
devices have limited computing power, which prohibits them from running large
scale visual analytics neural networks. An emerging approach to solve this
problem is to offload the computation of these neural networks to computing
resources at an edge server. Efficient computation offloading requires
optimizing the trade-off between multiple objectives including compressed data
rate, analytics performance, and computation speed. In this work, we consider a
"split computation" system to offload a part of the computation of the YOLO
object detection model. We propose a learnable feature compression approach to
compress the intermediate YOLO features with light-weight computation. We train
the feature compression and decompression module together with the YOLO model
to optimize the object detection accuracy under a rate constraint. Compared to
baseline methods that apply either standard image compression or learned image
compression at the mobile and perform image decompression and YOLO at the edge,
the proposed system achieves higher detection accuracy at the low to medium
rate range. Furthermore, the proposed system requires substantially lower
computation time on the mobile device with CPU only.
- Abstract(参考訳): コンピュータビジョンの最近の進歩は、モバイルデバイスにビジュアル分析モデルを展開することへの関心が高まっている。
しかし、ほとんどのモバイルデバイスは計算能力に制限があり、大規模なビジュアル分析ニューラルネットワークの実行を禁止している。
この問題を解決するための新たなアプローチは、これらのニューラルネットワークの計算をエッジサーバのコンピューティングリソースにオフロードすることだ。
効率的な計算オフロードでは、圧縮されたデータレート、分析性能、計算速度を含む複数の目的間のトレードオフを最適化する必要がある。
本研究では、YOLOオブジェクト検出モデルの計算の一部をオフロードする「分割計算」システムについて検討する。
本稿では,中間のyolo特徴を軽量計算で圧縮する学習可能な特徴圧縮手法を提案する。
特徴圧縮・減圧モジュールをyoloモデルと共に訓練し,レート制約下での物体検出精度を最適化する。
標準画像圧縮や学習画像圧縮をモバイルで適用し,エッジで画像圧縮やYOLOを行うベースライン手法と比較して,提案方式は低~中程度の速度で高い検出精度を実現する。
さらに,提案システムではCPUのみのモバイルデバイス上での計算時間を大幅に削減する必要がある。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Dynamic Semantic Compression for CNN Inference in Multi-access Edge
Computing: A Graph Reinforcement Learning-based Autoencoder [82.8833476520429]
部分オフロードにおける効果的な意味抽出と圧縮のための新しい意味圧縮手法であるオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
セマンティックエンコーダでは、CNNのチャネルアテンション機構に基づく特徴圧縮モジュールを導入し、最も情報性の高い特徴を選択して中間データを圧縮する。
セマンティックデコーダでは、受信した圧縮データから学習して中間データを再構築し、精度を向上させる軽量デコーダを設計する。
論文 参考訳(メタデータ) (2024-01-19T15:19:47Z) - Slimmable Encoders for Flexible Split DNNs in Bandwidth and Resource
Constrained IoT Systems [12.427821850039448]
本稿では,スリム化可能なアンサンブルエンコーダに基づく分割計算手法を提案する。
私たちの設計の主な利点は、計算負荷と送信データサイズを最小限のオーバーヘッドと時間でリアルタイムで適応できることです。
本モデルでは,圧縮効率や実行時間,特にモバイルデバイスの弱い状況において,既存のソリューションよりも優れています。
論文 参考訳(メタデータ) (2023-06-22T06:33:12Z) - Spatiotemporal Attention-based Semantic Compression for Real-time Video
Recognition [117.98023585449808]
本稿では,各フレームにおけるフレームと画素の重要性を評価するために,時間的注意に基づくオートエンコーダ(STAE)アーキテクチャを提案する。
我々は3D-2D CNNを組み合わせた軽量デコーダを開発し、欠落した情報を再構成する。
実験の結果,VT_STAEはビデオデータセットH51を,5%の精度で104倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2023-05-22T07:47:27Z) - Pushing the Limits of Asynchronous Graph-based Object Detection with
Event Cameras [62.70541164894224]
低計算を維持しながら、そのようなモデルの深さと複雑さを拡大できるアーキテクチャ選択をいくつか導入する。
我々の手法は、密度の高いグラフニューラルネットワークよりも3.7倍高速に動作し、前方通過はわずか8.4msである。
論文 参考訳(メタデータ) (2022-11-22T15:14:20Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - Accelerating Deep Learning Applications in Space [0.0]
拘束デバイス上でのCNNを用いた物体検出の性能について検討する。
我々は、Single Shot MultiBox Detector (SSD)とリージョンベースのFully Convolutional Network (R-FCN)について詳しく検討する。
性能は、推測時間、メモリ消費、精度で測定される。
論文 参考訳(メタデータ) (2020-07-21T21:06:30Z) - CNN Acceleration by Low-rank Approximation with Quantized Factors [9.654865591431593]
現代の畳み込みニューラルネットワークは複雑なコンピュータビジョンタスクの解決において大きな成果を上げているが、モバイルや組み込みデバイスでは効果的に利用できない。
この問題を解決するために、タッカー形式の低ランクテンソル近似と重みの量子化と特徴写像(アクティベーション)という2つの既知の手法を組み合わせた新しい手法を提案する。
CIFAR-10, CIFAR-100, Imagenet分類タスクにおけるResNet18とResNet34の効率を実証した。
論文 参考訳(メタデータ) (2020-06-16T02:28:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。