Fugu-MT 論文翻訳(概要): Post-Training Quantization for Object Detection

論文の概要: Post-Training Quantization for Object Detection

arxiv url: http://arxiv.org/abs/2304.09785v1
Date: Wed, 19 Apr 2023 16:11:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-20 13:47:04.936547
Title: Post-Training Quantization for Object Detection
Title（参考訳）: 物体検出のための後処理量子化
Authors: Lin Niu, Jiawei Liu, Zhihang Yuan, Dawei Yang, Xinggang Wang, Wenyu Liu
Abstract要約: PTQ(Post-Training Quantization)は、完全精度モデルを直接低ビット幅に変換する。 PTQは、オブジェクト検出などの複雑なタスクに適用した場合、深刻な精度低下を被る。 DetPTQは、最適な量子化パラメータを選択するためにODOLベースの適応Lpメトリックを使用する。
参考スコア（独自算出の注目度）: 43.81334288840746
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Efficient inference for object detection networks is a major challenge on edge devices. Post-Training Quantization (PTQ), which transforms a full-precision model into low bit-width directly, is an effective and convenient approach to reduce model inference complexity. But it suffers severe accuracy drop when applied to complex tasks such as object detection. PTQ optimizes the quantization parameters by different metrics to minimize the perturbation of quantization. The p-norm distance of feature maps before and after quantization, Lp, is widely used as the metric to evaluate perturbation. For the specialty of object detection network, we observe that the parameter p in Lp metric will significantly influence its quantization performance. We indicate that using a fixed hyper-parameter p does not achieve optimal quantization performance. To mitigate this problem, we propose a framework, DetPTQ, to assign different p values for quantizing different layers using an Object Detection Output Loss (ODOL), which represents the task loss of object detection. DetPTQ employs the ODOL-based adaptive Lp metric to select the optimal quantization parameters. Experiments show that our DetPTQ outperforms the state-of-the-art PTQ methods by a significant margin on both 2D and 3D object detectors. For example, we achieve 31.1/31.7(quantization/full-precision) mAP on RetinaNet-ResNet18 with 4-bit weight and 4-bit activation.
Abstract（参考訳）: オブジェクト検出ネットワークの効率的な推論は、エッジデバイスにおいて大きな課題である。完全精度モデルを直接低ビット幅に変換するPTQ(Post-Training Quantization)は、モデル推論の複雑さを減らすための効果的で便利なアプローチである。しかし、オブジェクト検出などの複雑なタスクに適用すると、かなり精度が低下する。 PTQは量子化パラメータを異なるメトリクスで最適化し、量子化の摂動を最小化する。量子化前後の特徴写像のp-ノルム距離 Lp は摂動を評価する計量として広く用いられている。対象検出ネットワークの特殊性について,lpメトリックのパラメータpが量子化性能に大きく影響することを示す。固定ハイパーパラメータpは最適量子化性能を達成できないことを示す。この問題を軽減するため,我々は,オブジェクト検出のタスク損失を表す object detection output loss (odol) を用いて,異なるレイヤを定量化するための異なる p 値を割り当てるフレームワーク detptq を提案する。 DetPTQは最適な量子化パラメータを選択するためにODOLベースの適応Lpメトリックを使用する。実験の結果,DetPTQは2次元と3次元の両方の物体検出器において,最先端のPTQ法よりも優れていた。例えば、RetinaNet-ResNet18上では、31.1/31.7(量子化/フル精度)のmAPを4ビットの重みと4ビットの活性化で達成する。

関連論文リスト

Mixed Precision PointPillars for Efficient 3D Object Detection with TensorRT [0.0]
我々はPointPillars用に設計された混合精度フレームワークを提案する。本手法はPTQパイプラインをトレーニングせずに混合精度モデルを提供する。 RTデプロイメントでは、当社のモデルは、それぞれ2.35倍と2.26倍のレイテンシとサイズを提供する。
論文参考訳（メタデータ） (2026-01-19T00:59:13Z)
PTQAT: A Hybrid Parameter-Efficient Quantization Algorithm for 3D Perception Tasks [9.463776523295303]
ポストトレーニング量子化(PTQ)と量子アウェアトレーニング(QAT)は、2つの主流モデル量子化アプローチを表す。本稿では,3次元知覚ネットワークの効率的な展開のための新しいハイブリッド量子化アルゴリズムPTQATを提案する。
論文参考訳（メタデータ） (2025-08-14T11:55:21Z)
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs [0.8999666725996975]
混合精度(MP)は、ネットワーク層間での数値的精度の変化によってトレードオフを緩和する。本研究では,PTQ(Post-Training Quantization)内の最適なMP構成を自動的に選択することに焦点を当てた。
論文参考訳（メタデータ） (2025-05-19T12:51:02Z)
APHQ-ViT: Post-Training Quantization with Average Perturbation Hessian Based Reconstruction for Vision Transformers [71.2294205496784]
平均摂動ヘシアン (APH) を用いた重要度推定に基づく新しいPTQ手法である textbfAPHQ-ViT を提案する。本稿では,線形量子化器を用いたAPHQ-ViTが既存のPTQ法よりも3ビット,4ビットの差が大きいことを示す。
論文参考訳（メタデータ） (2025-04-03T11:48:56Z)
Q-VLM: Post-training Quantization for Large Vision-Language Models [73.19871905102545]
本稿では,大規模視覚言語モデル(LVLM)の学習後量子化フレームワークを提案する。視覚言語モデル全体の離散化誤差に大きな影響を及ぼす層間依存関係を抽出し、この依存関係を最適な量子化戦略に組み込む。実験の結果,提案手法はメモリを2.78倍圧縮し,出力速度を約13B LLaVAモデルで1.44倍向上させることができた。
論文参考訳（メタデータ） (2024-10-10T17:02:48Z)
LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object Detection [35.35457515189062]
ポストトレーニング量子化(PTQ)は2次元視覚タスクで広く採用されている。センターポイントに適用した場合、LiDAR-PTQは最先端の量子化性能が得られる。 LiDAR-PTQは、量子化対応のトレーニング手法よりも30倍高速である。
論文参考訳（メタデータ） (2024-01-29T03:35:55Z)
On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks [52.97107229149988]
エッジデバイス上でハードウェア対応の混合精度量子化を行うOn-Chipハードウェア・アウェア量子化フレームワークを提案する。このパイプラインは、量子化プロセスが量子化演算子の実際のハードウェア効率を知覚することを可能にする。精度測定のために,マルチチップシナリオにおける演算子の精度への影響を効果的に推定するMask-Guided Quantization Estimation技術を提案する。
論文参考訳（メタデータ） (2023-09-05T04:39:34Z)
ARS-DETR: Aspect Ratio-Sensitive Detection Transformer for Aerial Oriented Object Detection [55.291579862817656]
既存のオブジェクト指向オブジェクト検出手法では、モデルの性能を測定するために計量AP$_50$が一般的である。我々は、AP$_50$は本来、角度偏差に大きな耐性があるため、オブジェクト指向物体検出には適さないと主張している。本稿では,ARS-DETR(Aspect Ratio Sensitive Oriented Object Detector with Transformer)を提案する。
論文参考訳（メタデータ） (2023-03-09T02:20:56Z)
PD-Quant: Post-Training Quantization based on Prediction Difference Metric [43.81334288840746]
ポストトレーニング量子化(PTQ)は、ニューラルネットワーク圧縮技術で、完全精度のモデルを低精度のデータ型を使用した量子化モデルに変換する。適切な量子化パラメータを決定する方法が、現在直面している主要な問題である。 PD-Quantは、グローバル情報を考慮してこの制限に対処する手法である。
論文参考訳（メタデータ） (2022-12-14T05:48:58Z)
SALISA: Saliency-based Input Sampling for Efficient Video Object Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。 SALISAは小物体の検出を著しく改善することを示す。
論文参考訳（メタデータ） (2022-04-05T17:59:51Z)
n-hot: Efficient bit-level sparsity for powers-of-two neural network quantization [0.0]
パワーオブツー(PoT)量子化は、リソース制約ハードウェア上でのディープニューラルネットワークのビット演算数を減少させる。 PoT量子化は、表現能力が限られているため、深刻な精度低下を引き起こす。メモリ効率の高い方法で精度とコストを両立した効率的なPoT量子化方式を提案する。
論文参考訳（メタデータ） (2021-03-22T10:13:12Z)
AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文参考訳（メタデータ） (2020-07-14T09:07:29Z)
Optimisation of the PointPillars network for 3D object detection in point clouds [1.1470070927586016]
本稿では,3次元物体検出のための深層ニューラルネットワークの最適化について述べる。我々は、検出精度と計算複雑性との間に合理的な妥協をもたらすPointPillarsネットワークの実験を行った。これにより、低消費電力でリアルタイムのLiDARデータ処理が可能になる。
論文参考訳（メタデータ） (2020-07-01T13:50:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。