Fugu-MT 論文翻訳(概要): R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning

論文の概要: R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning

arxiv url: http://arxiv.org/abs/2303.02191v1
Date: Fri, 3 Mar 2023 19:26:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-07 21:11:19.684553
Title: R-TOSS: A Framework for Real-Time Object Detection using Semi-Structured Pruning
Title（参考訳）: R-TOSS:半構造化プルーニングを用いたリアルタイム物体検出フレームワーク
Authors: Abhishek Balasubramaniam, Febin P Sunny, Sudeep Pasricha
Abstract要約: R-TOSSと呼ばれる新しい半構造化プルーニングフレームワークを導入する。 R-TOSSは最先端のモデルプルーニング技術の欠点を克服する。
参考スコア（独自算出の注目度）: 3.577310844634503
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Object detectors used in autonomous vehicles can have high memory and computational overheads. In this paper, we introduce a novel semi-structured pruning framework called R-TOSS that overcomes the shortcomings of state-of-the-art model pruning techniques. Experimental results on the JetsonTX2 show that R-TOSS has a compression rate of 4.4x on the YOLOv5 object detector with a 2.15x speedup in inference time and 57.01% decrease in energy usage. R-TOSS also enables 2.89x compression on RetinaNet with a 1.86x speedup in inference time and 56.31% decrease in energy usage. We also demonstrate significant improvements compared to various state-of-the-art pruning techniques.
Abstract（参考訳）: 自動運転車で使用される物体検出器は、高いメモリと計算オーバーヘッドを持つ。本稿では,最先端モデルプルーニング技術の欠点を克服する,r-tossと呼ばれる新しい半構造化プルーニングフレームワークを提案する。ジェットソンTX2の実験結果によると、R-TOSSはYOLOv5オブジェクト検出器の圧縮速度が4.4倍で、推論時間は2.15倍、エネルギー使用量は57.01%減少している。 R-TOSSはまた、RetinaNet上の2.89倍の圧縮を可能にし、推論時間の1.86倍のスピードアップと56.31%のエネルギー消費を減少させる。また,最先端のプルーニング技術に比べ,大幅な改善がみられた。

関連論文リスト

Exploiting Lightweight Hierarchical ViT and Dynamic Framework for Efficient Visual Tracking [49.07982079554859]
トランスフォーマーをベースとしたビジュアルトラッカーは、その強力なモデリング能力のために大きな進歩を見せている。しかし、処理速度が遅いため、リソース制約のあるデバイスでは実用性に制限がある。各種デバイス間の高速動作を維持しながら高い性能を実現するための,効率的な追跡モデルであるHiTを提案する。
論文参考訳（メタデータ） (2025-06-25T12:46:46Z)
You Sense Only Once Beneath: Ultra-Light Real-Time Underwater Object Detection [2.5249064981269296]
超軽量リアルタイム水中物体検出フレームワークYSOOB(You Sense Only Beneath)を提案する。具体的には、マルチスペクトルウェーブレット(MSWE)を用いて入力画像の周波数領域符号化を行い、水中光色歪みによる意味損失を最小限に抑える。また、単純で効果的なチャネル圧縮によりモデル冗長性を排除し、モデル軽量化のために大カーネル畳み込み(RLKC)を再構築する。
論文参考訳（メタデータ） (2025-04-22T08:26:35Z)
UPAQ: A Framework for Real-Time and Energy-Efficient 3D Object Detection in Autonomous Vehicles [4.403687945412488]
本稿では,資源制約された組込みAVプラットフォーム上でのLiDAR点雲とカメラベースの3Dオブジェクト検出器の効率向上のために,半構造化パターンプルーニングと量子化を利用したUPAQという新しいフレームワークを提案する。 Jetson Orin Nanoの組み込みプラットフォームでの実験結果から、UPAQは最大5.62倍と5.13倍のモデル圧縮速度、最大1.97倍と1.86倍の推論速度、最大2.07倍と1.87倍のエネルギー消費を実現している。
論文参考訳（メタデータ） (2025-01-08T01:18:14Z)
EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文参考訳（メタデータ） (2023-02-15T06:05:14Z)
A Fair Loss Function for Network Pruning [70.35230425589592]
本稿では, 刈り込み時のバイアスの抑制に使用できる簡易な改良型クロスエントロピー損失関数である, 性能重み付き損失関数を提案する。 CelebA、Fitzpatrick17k、CIFAR-10データセットを用いた実験は、提案手法が単純で効果的なツールであることを実証している。
論文参考訳（メタデータ） (2022-11-18T15:17:28Z)
Differentiable Architecture Search with Random Features [80.31916993541513]
微分可能なアーキテクチャサーチ (DARTS) は、探索効率と効率性からNAS技術の発展を著しく促進してきたが、性能の低下に悩まされている。本稿では,BatchNormのトレーニングのみによるDARTSの性能崩壊問題を軽減するための取り組みを行う。
論文参考訳（メタデータ） (2022-08-18T13:55:27Z)
MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。 MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文参考訳（メタデータ） (2022-04-27T14:00:48Z)
BottleFit: Learning Compressed Representations in Deep Neural Networks for Effective and Efficient Split Computing [48.11023234245863]
圧縮速度が強い場合でも高い精度を達成するための新しいトレーニング戦略を含む,BottleFitと呼ばれる新しいフレームワークを提案する。 BottleFitは77.1%のデータ圧縮を実現し、ImageNetデータセットでは最大で0.6%の精度でロスする。本稿では,BottleFitが消費電力とレイテンシを最大で49%,(w.r.t.)ローカルコンピューティングでは89%,エッジオフロードでは37%,W.r.t.エッジオフロードでは55%削減することを示した。
論文参考訳（メタデータ） (2022-01-07T22:08:07Z)
Operationalizing Convolutional Neural Network Architectures for Prohibited Object Detection in X-Ray Imagery [15.694880385913534]
本稿では,近年の2つのエンドツーエンドオブジェクト検出CNNアーキテクチャ,Cascade R-CNNとFreeAnchorの実現可能性について検討する。パラメータが少なく訓練時間も少ないため、FreeAnchorは13 fps (3.9 ms)の最大検出速度を達成している。 CNNモデルは、損失のある圧縮に対してかなりのレジリエンスを示し、JPEG圧縮レベル50においてmAPの1.1%しか減少しない。
論文参考訳（メタデータ） (2021-10-10T21:20:04Z)
ATTACC the Quadratic Bottleneck of Attention Layers [3.2741800634280245]
本稿では、ディープニューラルネットワーク(DNN)アクセラレーターのための新しいアテンション調整データフローであるFLATを紹介する。高帯域幅で低容量のオンチップバッファを効率的に利用することで、効果的なメモリ帯域幅を増大させる。評価では,ATTACCは最先端エッジやクラウドアクセラレータと比較して1.94倍,1.76倍,49%,42%のエネルギー削減を達成した。
論文参考訳（メタデータ） (2021-07-13T22:23:40Z)
Toward Compact Deep Neural Networks via Energy-Aware Pruning [2.578242050187029]
ネットワークにおける各フィルタの重要性を核ノルム(NN)を用いて定量化する新しいエネルギー対応プルーニング手法を提案する。 FLOPの40.4/49.8%、パラメータ還元の45.9/52.9%、トップ1の精度の94.13/94.61%、CIFAR-10のResNet-56/110で競合する結果を得た。
論文参考訳（メタデータ） (2021-03-19T15:33:16Z)
FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文参考訳（メタデータ） (2021-03-08T03:09:37Z)
YOLObile: Real-Time Object Detection on Mobile Devices via Compression-Compilation Co-Design [38.98949683262209]
本稿では,モバイル端末上でリアルタイムなオブジェクト検出を行う YOLObile フレームワークを提案する。任意のカーネルサイズに対して新しいブロックパンチプルーニング方式を提案する。 YOLObileフレームワークでは,Samsung Galaxy S20上でGPUを用いて17FPSの推論速度を実現している。
論文参考訳（メタデータ） (2020-09-12T01:41:08Z)
REST: Robust and Efficient Neural Networks for Sleep Monitoring in the Wild [62.36144064259933]
ニューラルネットワークの逆トレーニングとLipschitz定数の制御を通じて、両問題に同時に対処する新しい方法であるRESTを提案する。私たちは、RESTがノイズの存在下で、オリジナルのフルサイズのモデルを大幅に上回る、ロバストで効率的なモデルを生成することを実証しています。これらのモデルをスマートフォン上のAndroidアプリケーションにデプロイすることにより、RESTによってモデルが最大17倍のエネルギー削減と9倍高速な推論を達成することができることを定量的に観察する。
論文参考訳（メタデータ） (2020-01-29T17:23:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。