論文の概要: R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured
Pruning
- arxiv url: http://arxiv.org/abs/2303.02191v1
- Date: Fri, 3 Mar 2023 19:26:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 21:11:19.684553
- Title: R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured
Pruning
- Title(参考訳): R-TOSS:半構造化プルーニングを用いたリアルタイム物体検出フレームワーク
- Authors: Abhishek Balasubramaniam, Febin P Sunny, Sudeep Pasricha
- Abstract要約: R-TOSSと呼ばれる新しい半構造化プルーニングフレームワークを導入する。
R-TOSSは最先端のモデルプルーニング技術の欠点を克服する。
- 参考スコア(独自算出の注目度): 3.577310844634503
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object detectors used in autonomous vehicles can have high memory and
computational overheads. In this paper, we introduce a novel semi-structured
pruning framework called R-TOSS that overcomes the shortcomings of
state-of-the-art model pruning techniques. Experimental results on the
JetsonTX2 show that R-TOSS has a compression rate of 4.4x on the YOLOv5 object
detector with a 2.15x speedup in inference time and 57.01% decrease in energy
usage. R-TOSS also enables 2.89x compression on RetinaNet with a 1.86x speedup
in inference time and 56.31% decrease in energy usage. We also demonstrate
significant improvements compared to various state-of-the-art pruning
techniques.
- Abstract(参考訳): 自動運転車で使用される物体検出器は、高いメモリと計算オーバーヘッドを持つ。
本稿では,最先端モデルプルーニング技術の欠点を克服する,r-tossと呼ばれる新しい半構造化プルーニングフレームワークを提案する。
ジェットソンTX2の実験結果によると、R-TOSSはYOLOv5オブジェクト検出器の圧縮速度が4.4倍で、推論時間は2.15倍、エネルギー使用量は57.01%減少している。
R-TOSSはまた、RetinaNet上の2.89倍の圧縮を可能にし、推論時間の1.86倍のスピードアップと56.31%のエネルギー消費を減少させる。
また,最先端のプルーニング技術に比べ,大幅な改善がみられた。
関連論文リスト
- EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - A Fair Loss Function for Network Pruning [70.35230425589592]
本稿では, 刈り込み時のバイアスの抑制に使用できる簡易な改良型クロスエントロピー損失関数である, 性能重み付き損失関数を提案する。
CelebA、Fitzpatrick17k、CIFAR-10データセットを用いた実験は、提案手法が単純で効果的なツールであることを実証している。
論文 参考訳(メタデータ) (2022-11-18T15:17:28Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - BottleFit: Learning Compressed Representations in Deep Neural Networks
for Effective and Efficient Split Computing [48.11023234245863]
圧縮速度が強い場合でも高い精度を達成するための新しいトレーニング戦略を含む,BottleFitと呼ばれる新しいフレームワークを提案する。
BottleFitは77.1%のデータ圧縮を実現し、ImageNetデータセットでは最大で0.6%の精度でロスする。
本稿では,BottleFitが消費電力とレイテンシを最大で49%,(w.r.t.)ローカルコンピューティングでは89%,エッジオフロードでは37%,W.r.t.エッジオフロードでは55%削減することを示した。
論文 参考訳(メタデータ) (2022-01-07T22:08:07Z) - Operationalizing Convolutional Neural Network Architectures for
Prohibited Object Detection in X-Ray Imagery [15.694880385913534]
本稿では,近年の2つのエンドツーエンドオブジェクト検出CNNアーキテクチャ,Cascade R-CNNとFreeAnchorの実現可能性について検討する。
パラメータが少なく訓練時間も少ないため、FreeAnchorは13 fps (3.9 ms)の最大検出速度を達成している。
CNNモデルは、損失のある圧縮に対してかなりのレジリエンスを示し、JPEG圧縮レベル50においてmAPの1.1%しか減少しない。
論文 参考訳(メタデータ) (2021-10-10T21:20:04Z) - ATTACC the Quadratic Bottleneck of Attention Layers [3.2741800634280245]
本稿では、ディープニューラルネットワーク(DNN)アクセラレーターのための新しいアテンション調整データフローであるFLATを紹介する。
高帯域幅で低容量のオンチップバッファを効率的に利用することで、効果的なメモリ帯域幅を増大させる。
評価では,ATTACCは最先端エッジやクラウドアクセラレータと比較して1.94倍,1.76倍,49%,42%のエネルギー削減を達成した。
論文 参考訳(メタデータ) (2021-07-13T22:23:40Z) - Toward Compact Deep Neural Networks via Energy-Aware Pruning [2.578242050187029]
ネットワークにおける各フィルタの重要性を核ノルム(NN)を用いて定量化する新しいエネルギー対応プルーニング手法を提案する。
FLOPの40.4/49.8%、パラメータ還元の45.9/52.9%、トップ1の精度の94.13/94.61%、CIFAR-10のResNet-56/110で競合する結果を得た。
論文 参考訳(メタデータ) (2021-03-19T15:33:16Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - YOLObile: Real-Time Object Detection on Mobile Devices via
Compression-Compilation Co-Design [38.98949683262209]
本稿では,モバイル端末上でリアルタイムなオブジェクト検出を行う YOLObile フレームワークを提案する。
任意のカーネルサイズに対して新しいブロックパンチプルーニング方式を提案する。
YOLObileフレームワークでは,Samsung Galaxy S20上でGPUを用いて17FPSの推論速度を実現している。
論文 参考訳(メタデータ) (2020-09-12T01:41:08Z) - REST: Robust and Efficient Neural Networks for Sleep Monitoring in the
Wild [62.36144064259933]
ニューラルネットワークの逆トレーニングとLipschitz定数の制御を通じて、両問題に同時に対処する新しい方法であるRESTを提案する。
私たちは、RESTがノイズの存在下で、オリジナルのフルサイズのモデルを大幅に上回る、ロバストで効率的なモデルを生成することを実証しています。
これらのモデルをスマートフォン上のAndroidアプリケーションにデプロイすることにより、RESTによってモデルが最大17倍のエネルギー削減と9倍高速な推論を達成することができることを定量的に観察する。
論文 参考訳(メタデータ) (2020-01-29T17:23:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。