論文の概要: Task-Specific Zero-shot Quantization-Aware Training for Object Detection
- arxiv url: http://arxiv.org/abs/2507.16782v1
- Date: Tue, 22 Jul 2025 17:28:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.220096
- Title: Task-Specific Zero-shot Quantization-Aware Training for Object Detection
- Title(参考訳): タスク特異的ゼロショット量子化-物体検出のための学習
- Authors: Changhao Li, Xinrui Chen, Ji Wang, Kang Zhao, Jianfei Chen,
- Abstract要約: 量子化は、ネットワークサイズと計算複雑性を減らすための重要な技術である。
ZSQは、事前訓練されたモデルから生成された合成データを用いてこの問題に対処する。
本稿では,オブジェクト検出ネットワークのためのタスク固有ZSQフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.715774951295021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantization is a key technique to reduce network size and computational complexity by representing the network parameters with a lower precision. Traditional quantization methods rely on access to original training data, which is often restricted due to privacy concerns or security challenges. Zero-shot Quantization (ZSQ) addresses this by using synthetic data generated from pre-trained models, eliminating the need for real training data. Recently, ZSQ has been extended to object detection. However, existing methods use unlabeled task-agnostic synthetic images that lack the specific information required for object detection, leading to suboptimal performance. In this paper, we propose a novel task-specific ZSQ framework for object detection networks, which consists of two main stages. First, we introduce a bounding box and category sampling strategy to synthesize a task-specific calibration set from the pre-trained network, reconstructing object locations, sizes, and category distributions without any prior knowledge. Second, we integrate task-specific training into the knowledge distillation process to restore the performance of quantized detection networks. Extensive experiments conducted on the MS-COCO and Pascal VOC datasets demonstrate the efficiency and state-of-the-art performance of our method. Our code is publicly available at: https://github.com/DFQ-Dojo/dfq-toolkit .
- Abstract(参考訳): 量子化は、ネットワークパラメータを低い精度で表現することで、ネットワークサイズと計算複雑性を低減するための重要な手法である。
従来の量子化手法は、プライバシの懸念やセキュリティ上の問題によって制限されることが多い、オリジナルのトレーニングデータへのアクセスに依存している。
Zero-shot Quantization (ZSQ)は、事前訓練されたモデルから生成された合成データを使用してこの問題に対処し、実際のトレーニングデータを必要としない。
近年、ZSQはオブジェクト検出に拡張されている。
しかし、既存の手法では、オブジェクト検出に必要な特定の情報を持たない未ラベルのタスク非依存の合成画像を使用しており、それによってサブ最適化性能が向上する。
本稿では,2つの主要な段階からなるオブジェクト検出ネットワークのためのタスク固有ZSQフレームワークを提案する。
まず,事前学習したネットワークからタスク固有のキャリブレーションセットを合成し,事前知識のないオブジェクトの位置,サイズ,カテゴリ分布を再構成する境界ボックスとカテゴリサンプリング戦略を提案する。
第2に,タスク固有のトレーニングを知識蒸留プロセスに統合し,量子化検出ネットワークの性能を回復する。
MS-COCO と Pascal のVOC データセットを用いた大規模な実験により,本手法の効率性と最先端性能を実証した。
私たちのコードは、https://github.com/DFQ-Dojo/dfq-toolkitで公開されています。
関連論文リスト
- A Fresh Take on Stale Embeddings: Improving Dense Retriever Training with Corrector Networks [81.2624272756733]
密集検索では、ディープエンコーダは入力とターゲットの両方に埋め込みを提供する。
我々は、古いキャッシュされたターゲット埋め込みを調整できる小さなパラメトリック補正ネットワークを訓練する。
私たちのアプローチは、トレーニング中にターゲット埋め込み更新が行われなくても、最先端の結果と一致します。
論文 参考訳(メタデータ) (2024-09-03T13:29:13Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Complementary Learning Subnetworks for Parameter-Efficient
Class-Incremental Learning [40.13416912075668]
本稿では,2つの補完学習サブネットワークス間のシナジーを通じて連続的に学習するリハーサルフリーなCILアプローチを提案する。
提案手法は, 精度向上, メモリコスト, トレーニング効率, タスク順序など, 最先端手法と競合する結果が得られる。
論文 参考訳(メタデータ) (2023-06-21T01:43:25Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - Learning Representations for CSI Adaptive Quantization and Feedback [51.14360605938647]
本稿では,周波数分割二重化システムにおける適応量子化とフィードバックの効率的な手法を提案する。
既存の研究は主に、CSI圧縮のためのオートエンコーダ(AE)ニューラルネットワークの実装に焦点を当てている。
1つはポストトレーニング量子化に基づくもので、もう1つはAEのトレーニング中にコードブックが見つかる方法である。
論文 参考訳(メタデータ) (2022-07-13T08:52:13Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Incremental Few-Shot Object Detection [96.02543873402813]
OpeN-ended Centre nEtは、いくつかの例でクラスオブジェクトの検出を漸進的に学習する検出器である。
ONCEはインクリメンタルな学習パラダイムを十分に尊重しており、新しいクラス登録では、数発のトレーニングサンプルを1回だけフォワードパスするだけでよい。
論文 参考訳(メタデータ) (2020-03-10T12:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。