論文の概要: Q-YOLO: Efficient Inference for Real-time Object Detection
- arxiv url: http://arxiv.org/abs/2307.04816v1
- Date: Sat, 1 Jul 2023 03:50:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-16 04:04:25.777022
- Title: Q-YOLO: Efficient Inference for Real-time Object Detection
- Title(参考訳): Q-YOLO:リアルタイム物体検出のための効率的な推論
- Authors: Mingze Wang, Huixin Sun, Jun Shi, Xuhui Liu, Baochang Zhang, Xianbin
Cao
- Abstract要約: リアルタイム物体検出は様々なコンピュータビジョンアプリケーションにおいて重要な役割を果たす。
リソース制約のあるプラットフォームにリアルタイムオブジェクト検出器をデプロイすることは、高い計算量とメモリ要求のために課題となる。
本稿ではQ-YOLOと呼ばれる高効率の一段検出器を構築するための低ビット量子化法について述べる。
- 参考スコア(独自算出の注目度): 29.51643492051404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time object detection plays a vital role in various computer vision
applications. However, deploying real-time object detectors on
resource-constrained platforms poses challenges due to high computational and
memory requirements. This paper describes a low-bit quantization method to
build a highly efficient one-stage detector, dubbed as Q-YOLO, which can
effectively address the performance degradation problem caused by activation
distribution imbalance in traditional quantized YOLO models. Q-YOLO introduces
a fully end-to-end Post-Training Quantization (PTQ) pipeline with a
well-designed Unilateral Histogram-based (UH) activation quantization scheme,
which determines the maximum truncation values through histogram analysis by
minimizing the Mean Squared Error (MSE) quantization errors. Extensive
experiments on the COCO dataset demonstrate the effectiveness of Q-YOLO,
outperforming other PTQ methods while achieving a more favorable balance
between accuracy and computational cost. This research contributes to advancing
the efficient deployment of object detection models on resource-limited edge
devices, enabling real-time detection with reduced computational and memory
overhead.
- Abstract(参考訳): リアルタイム物体検出は様々なコンピュータビジョンアプリケーションにおいて重要な役割を果たす。
しかし、リソース制約のあるプラットフォームにリアルタイムオブジェクト検出装置をデプロイすることは、高い計算量とメモリ要求のために課題となる。
本稿では,従来の量子化ヨーロモデルにおけるアクティベーション分布の不均衡に起因する性能劣化問題に対して効果的に対処できる,高効率の一段階検出器q-yoloを構築するための低ビット量子化手法について述べる。
Q-YOLOは、一方向ヒストグラム(UH)アクティベーション量子化スキームを備えた完全エンドツーエンドのPTQ(Post-Training Quantization)パイプラインを導入し、平均二乗誤差(MSE)量子化誤差を最小化し、ヒストグラム解析により最大トランケーション値を決定する。
COCOデータセットの大規模な実験では、Q-YOLOの有効性が示され、他のPTQ手法よりも優れ、精度と計算コストのバランスが良好である。
本研究は,資源制限エッジデバイスへのオブジェクト検出モデルの効率的な展開に寄与し,計算およびメモリオーバーヘッドを低減したリアルタイム検出を実現する。
関連論文リスト
- P-YOLOv8: Efficient and Accurate Real-Time Detection of Distracted Driving [0.0]
引き離された運転は重大な安全上の問題であり、世界中で多くの死者と負傷につながっている。
本研究では、注意をそらされた運転行動を検出するための効率的でリアルタイムな機械学習モデルの必要性に対処する。
リアルタイムオブジェクト検出システムを導入し、速度と精度の両方に最適化する。
論文 参考訳(メタデータ) (2024-10-21T02:56:44Z) - Q-VLM: Post-training Quantization for Large Vision-Language Models [73.19871905102545]
本稿では,大規模視覚言語モデル(LVLM)の学習後量子化フレームワークを提案する。
視覚言語モデル全体の離散化誤差に大きな影響を及ぼす層間依存関係を抽出し、この依存関係を最適な量子化戦略に組み込む。
実験の結果,提案手法はメモリを2.78倍圧縮し,出力速度を約13B LLaVAモデルで1.44倍向上させることができた。
論文 参考訳(メタデータ) (2024-10-10T17:02:48Z) - Reducing the Side-Effects of Oscillations in Training of Quantized YOLO
Networks [5.036532914308394]
振動問題によるSOTA QAT法であっても, 効率の良いYOLOモデルでは, 極めて低精度(4ビット以下)を実現することは困難である。
そこで本研究では,QATの標準手順の後に1回の訓練を要し,誤りを訂正する簡単なQAT補正手法,すなわちQCを提案する。
論文 参考訳(メタデータ) (2023-11-09T02:53:21Z) - ELUQuant: Event-Level Uncertainty Quantification in Deep Inelastic
Scattering [0.0]
物理事象レベルでの詳細な不確実性定量化(UQ)のための流れを近似した物理インフォームドベイズニューラルネットワーク(BNN)を提案する。
Deep Inelastic Scattering (DIS) イベントに適用すると、我々のモデルはキネティック変数 $x$, $Q2$, $y$ を効果的に抽出する。
根底にある不確実性に関するこの詳細な説明は、特にイベントフィルタリングのようなタスクにおいて、意思決定には重要でないことを証明している。
論文 参考訳(メタデータ) (2023-10-04T15:50:05Z) - Drastic Circuit Depth Reductions with Preserved Adversarial Robustness
by Approximate Encoding for Quantum Machine Learning [0.5181797490530444]
本研究では, 変分, 遺伝的および行列積状態に基づくアルゴリズムを用いて, 符号化画像データを表す量子状態の効率的な作成法を実装した。
その結果、これらの手法は、標準状態準備実装よりも2桁も浅い回路を用いて、QMLに適したレベルにほぼ準備できることが判明した。
論文 参考訳(メタデータ) (2023-09-18T01:49:36Z) - Potential and limitations of quantum extreme learning machines [55.41644538483948]
本稿では,QRCとQELMをモデル化するフレームワークを提案する。
我々の分析は、QELMとQRCの両方の機能と限界をより深く理解するための道を開いた。
論文 参考訳(メタデータ) (2022-10-03T09:32:28Z) - Towards Balanced Learning for Instance Recognition [149.76724446376977]
本稿では,インスタンス認識のためのバランス学習のためのフレームワークであるLibra R-CNNを提案する。
IoUバランスのサンプリング、バランスの取れた特徴ピラミッド、客観的再重み付けをそれぞれ統合し、サンプル、特徴、客観的レベルの不均衡を低減します。
論文 参考訳(メタデータ) (2021-08-23T13:40:45Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - High Dimensional Level Set Estimation with Bayesian Neural Network [58.684954492439424]
本稿では,ベイズニューラルネットワークを用いた高次元レベル集合推定問題を解く新しい手法を提案する。
各問題に対して対応する理論情報に基づく取得関数を導出してデータポイントをサンプリングする。
合成データセットと実世界データセットの数値実験により,提案手法は既存手法よりも優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2020-12-17T23:21:53Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - EfficientPose: Scalable single-person pose estimation [3.325625311163864]
一人称ポーズ推定のための新しい畳み込みニューラルネットワークアーキテクチャであるEfficientPoseを提案する。
我々のトップパフォーマンスモデルは、低複雑さのConvNetを用いて、シングルパーソンMPIIにおける最先端の精度を実現する。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
論文 参考訳(メタデータ) (2020-04-25T16:50:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。