論文の概要: Improving Post-Training Quantization on Object Detection with Task
Loss-Guided Lp Metric
- arxiv url: http://arxiv.org/abs/2304.09785v2
- Date: Tue, 25 Apr 2023 07:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 02:59:38.439150
- Title: Improving Post-Training Quantization on Object Detection with Task
Loss-Guided Lp Metric
- Title(参考訳): task loss-guided lpメトリックによるオブジェクト検出におけるトレーニング後の量子化の改善
- Authors: Lin Niu, Jiawei Liu, Zhihang Yuan, Dawei Yang, Xinggang Wang, Wenyu
Liu
- Abstract要約: PTQ(Post-Training Quantization)は、完全精度モデルを直接低ビット幅に変換する。
PTQは、オブジェクト検出などの複雑なタスクに適用した場合、深刻な精度低下を被る。
DetPTQは、最適な量子化パラメータを選択するためにODOLベースの適応Lpメトリックを使用する。
- 参考スコア(独自算出の注目度): 43.81334288840746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient inference for object detection networks is a major challenge on
edge devices. Post-Training Quantization (PTQ), which transforms a
full-precision model into low bit-width directly, is an effective and
convenient approach to reduce model inference complexity. But it suffers severe
accuracy drop when applied to complex tasks such as object detection. PTQ
optimizes the quantization parameters by different metrics to minimize the
perturbation of quantization. The p-norm distance of feature maps before and
after quantization, Lp, is widely used as the metric to evaluate perturbation.
For the specialty of object detection network, we observe that the parameter p
in Lp metric will significantly influence its quantization performance. We
indicate that using a fixed hyper-parameter p does not achieve optimal
quantization performance. To mitigate this problem, we propose a framework,
DetPTQ, to assign different p values for quantizing different layers using an
Object Detection Output Loss (ODOL), which represents the task loss of object
detection. DetPTQ employs the ODOL-based adaptive Lp metric to select the
optimal quantization parameters. Experiments show that our DetPTQ outperforms
the state-of-the-art PTQ methods by a significant margin on both 2D and 3D
object detectors. For example, we achieve
31.1/31.7(quantization/full-precision) mAP on RetinaNet-ResNet18 with 4-bit
weight and 4-bit activation.
- Abstract(参考訳): オブジェクト検出ネットワークの効率的な推論は、エッジデバイスにおいて大きな課題である。
完全精度モデルを直接低ビット幅に変換するPTQ(Post-Training Quantization)は、モデル推論の複雑さを減らすための効果的で便利なアプローチである。
しかし、オブジェクト検出などの複雑なタスクに適用すると、かなり精度が低下する。
PTQは量子化パラメータを異なるメトリクスで最適化し、量子化の摂動を最小化する。
量子化前後の特徴写像のp-ノルム距離 Lp は摂動を評価する計量として広く用いられている。
対象検出ネットワークの特殊性について,lpメトリックのパラメータpが量子化性能に大きく影響することを示す。
固定ハイパーパラメータpは最適量子化性能を達成できないことを示す。
この問題を軽減するため,我々は,オブジェクト検出のタスク損失を表す object detection output loss (odol) を用いて,異なるレイヤを定量化するための異なる p 値を割り当てるフレームワーク detptq を提案する。
DetPTQは最適な量子化パラメータを選択するためにODOLベースの適応Lpメトリックを使用する。
実験の結果,DetPTQは2次元と3次元の両方の物体検出器において,最先端のPTQ法よりも優れていた。
例えば、RetinaNet-ResNet18上では、31.1/31.7(量子化/フル精度)のmAPを4ビットの重みと4ビットの活性化で達成する。
関連論文リスト
- Q-VLM: Post-training Quantization for Large Vision-Language Models [73.19871905102545]
本稿では,大規模視覚言語モデル(LVLM)の学習後量子化フレームワークを提案する。
視覚言語モデル全体の離散化誤差に大きな影響を及ぼす層間依存関係を抽出し、この依存関係を最適な量子化戦略に組み込む。
実験の結果,提案手法はメモリを2.78倍圧縮し,出力速度を約13B LLaVAモデルで1.44倍向上させることができた。
論文 参考訳(メタデータ) (2024-10-10T17:02:48Z) - LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object
Detection [35.35457515189062]
ポストトレーニング量子化(PTQ)は2次元視覚タスクで広く採用されている。
センターポイントに適用した場合、LiDAR-PTQは最先端の量子化性能が得られる。
LiDAR-PTQは、量子化対応のトレーニング手法よりも30倍高速である。
論文 参考訳(メタデータ) (2024-01-29T03:35:55Z) - On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks [52.97107229149988]
エッジデバイス上でハードウェア対応の混合精度量子化を行うOn-Chipハードウェア・アウェア量子化フレームワークを提案する。
このパイプラインは、量子化プロセスが量子化演算子の実際のハードウェア効率を知覚することを可能にする。
精度測定のために,マルチチップシナリオにおける演算子の精度への影響を効果的に推定するMask-Guided Quantization Estimation技術を提案する。
論文 参考訳(メタデータ) (2023-09-05T04:39:34Z) - ARS-DETR: Aspect Ratio-Sensitive Detection Transformer for Aerial Oriented Object Detection [55.291579862817656]
既存のオブジェクト指向オブジェクト検出手法では、モデルの性能を測定するために計量AP$_50$が一般的である。
我々は、AP$_50$は本来、角度偏差に大きな耐性があるため、オブジェクト指向物体検出には適さないと主張している。
本稿では,ARS-DETR(Aspect Ratio Sensitive Oriented Object Detector with Transformer)を提案する。
論文 参考訳(メタデータ) (2023-03-09T02:20:56Z) - PD-Quant: Post-Training Quantization based on Prediction Difference
Metric [43.81334288840746]
ポストトレーニング量子化(PTQ)は、ニューラルネットワーク圧縮技術で、完全精度のモデルを低精度のデータ型を使用した量子化モデルに変換する。
適切な量子化パラメータを決定する方法が、現在直面している主要な問題である。
PD-Quantは、グローバル情報を考慮してこの制限に対処する手法である。
論文 参考訳(メタデータ) (2022-12-14T05:48:58Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - n-hot: Efficient bit-level sparsity for powers-of-two neural network
quantization [0.0]
パワーオブツー(PoT)量子化は、リソース制約ハードウェア上でのディープニューラルネットワークのビット演算数を減少させる。
PoT量子化は、表現能力が限られているため、深刻な精度低下を引き起こす。
メモリ効率の高い方法で精度とコストを両立した効率的なPoT量子化方式を提案する。
論文 参考訳(メタデータ) (2021-03-22T10:13:12Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - Optimisation of the PointPillars network for 3D object detection in
point clouds [1.1470070927586016]
本稿では,3次元物体検出のための深層ニューラルネットワークの最適化について述べる。
我々は、検出精度と計算複雑性との間に合理的な妥協をもたらすPointPillarsネットワークの実験を行った。
これにより、低消費電力でリアルタイムのLiDARデータ処理が可能になる。
論文 参考訳(メタデータ) (2020-07-01T13:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。