Fugu-MT 論文翻訳(概要): Fisher-aware Quantization for DETR Detectors with Critical-category Objectives

論文の概要: Fisher-aware Quantization for DETR Detectors with Critical-category Objectives

arxiv url: http://arxiv.org/abs/2407.03442v1
Date: Wed, 3 Jul 2024 18:35:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-08 20:10:41.342374
Title: Fisher-aware Quantization for DETR Detectors with Critical-category Objectives
Title（参考訳）: 臨界カテゴリーを対象とするDETR検出器のフィッシャーアウェア量子化
Authors: Huanrui Yang, Yafeng Huang, Zhen Dong, Denis A Gudovskiy, Tomoyuki Okuno, Yohei Nakata, Yuan Du, Kurt Keutzer, Shanghang Zhang,
Abstract要約: この研究は、タスククリティカルなカテゴリのサブセット、すなわちクリティカルカテゴリのパフォーマンスを定義します。特定の臨界カテゴリは量子化に対する感度が高く、量子化対応訓練(QAT)後に過度に適合する傾向にある。このエビデンスを用いて、臨界カテゴリーの損失ランドスケープに対して、フィッシャー対応の混合精度量子化スキームと、QATに対するフィッシャートラス正規化を適用する。
参考スコア（独自算出の注目度）: 40.56686679553901
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The impact of quantization on the overall performance of deep learning models is a well-studied problem. However, understanding and mitigating its effects on a more fine-grained level is still lacking, especially for harder tasks such as object detection with both classification and regression objectives. This work defines the performance for a subset of task-critical categories, i.e. the critical-category performance, as a crucial yet largely overlooked fine-grained objective for detection tasks. We analyze the impact of quantization at the category-level granularity, and propose methods to improve performance for the critical categories. Specifically, we find that certain critical categories have a higher sensitivity to quantization, and are prone to overfitting after quantization-aware training (QAT). To explain this, we provide theoretical and empirical links between their performance gaps and the corresponding loss landscapes with the Fisher information framework. Using this evidence, we apply a Fisher-aware mixed-precision quantization scheme, and a Fisher-trace regularization for the QAT on the critical-category loss landscape. The proposed methods improve critical-category metrics of the quantized transformer-based DETR detectors. They are even more significant in case of larger models and higher number of classes where the overfitting becomes more severe. For example, our methods lead to 10.4% and 14.5% mAP gains for, correspondingly, 4-bit DETR-R50 and Deformable DETR on the most impacted critical classes in the COCO Panoptic dataset.
Abstract（参考訳）: ディープラーニングモデル全体のパフォーマンスに対する量子化の影響は、よく研究されている問題である。しかし、その効果をよりきめ細かなレベルで理解し緩和することは、特に分類と回帰の両方の目的を持つオブジェクト検出のような難しいタスクでは、依然として不足している。この研究は、タスククリティカルなカテゴリのサブセット、すなわちクリティカルカテゴリのパフォーマンスを、検出タスクの非常に重要で見過ごされがちな目標として定義する。本稿では,カテゴリレベルの粒度における量子化の影響を分析し,臨界カテゴリの性能向上手法を提案する。具体的には、特定の臨界カテゴリは量子化に対する感度が高く、量子化対応訓練(QAT)後に過度に適合する傾向にある。これを説明するために、Fisher情報フレームワークを用いて、それらの性能ギャップと対応する損失景観との間に理論的および実証的なリンクを提供する。このエビデンスを用いて、臨界カテゴリーの損失ランドスケープに対して、フィッシャー対応の混合精度量子化スキームと、QATに対するフィッシャートラス正規化を適用する。提案手法は量子化変圧器を用いたDECR検出器の臨界カテゴリー測定値を改善する。より大きなモデルや過剰適合がより深刻になるクラスの数が多い場合には、さらに重要である。例えば、COCO Panoptic データセットの最も影響の大きい臨界クラスにおいて、4ビット DETR-R50 と Deformable DETR の 10.4% と 14.5% の mAP ゲインが得られる。

関連論文リスト

Architectural Insights into Knowledge Distillation for Object Detection: A Comprehensive Review [1.374949083138427]
このレビューでは、CNNベースの検出器とTransformerベースの検出器を区別する、KD手法のための新しいアーキテクチャ中心の分類法を紹介した。提案した分類と分析は,オブジェクト検出におけるKDの進化する状況を明らかにすることを目的としており,現状の課題を浮き彫りにして,効率的でスケーラブルな検出システムに向けた今後の研究を導くことを目的としている。
論文参考訳（メタデータ） (2025-08-05T10:53:46Z)
Rethinking the Outlier Distribution in Large Language Models: An In-depth Study [4.740962650068888]
外乱は、しばしば相当量の量子化エラーを引き起こし、劣化したモデル性能をもたらす。近年の研究では、大規模なアクティベーション(英語版)とチャネルワイド・アウトリーチ(英語版)という、大きな言語モデルにおける2つの一般的なアウトリーチが特定されている。
論文参考訳（メタデータ） (2025-05-27T18:48:40Z)
CleanPose: Category-Level Object Pose Estimation via Causal Learning and Knowledge Distillation [18.453617417061245]
カテゴリーレベルのオブジェクトポーズ推定は、事前に定義されたカテゴリ内の未確認インスタンスの回転、翻訳、サイズを復元することを目的としている。ディープニューラルネットワークベースの手法は、優れたパフォーマンスを示しているが、"非クリーン"な共同設立者によって引き起こされた急激な相関に悩まされている。因果学習と知識蒸留を統合してカテゴリーレベルのポーズ推定を強化する新しいアプローチであるCleanPoseを提案する。
論文参考訳（メタデータ） (2025-02-03T12:41:36Z)
Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity [2.7574609288882312]
新たな損失関数であるクラス距離重み付きクロスエントロピー(CDW-CE)を提案する。これは、予測されたクラスと実際のクラスが遠く離れているときに、誤分類をより厳しく罰する。以上の結果から,CDW-CEは日常的な画像分類タスクの性能を一貫して向上させることがわかった。
論文参考訳（メタデータ） (2024-12-02T08:06:14Z)
Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM's Reasoning Capability [53.51560766150442]
臨界トークンは推論軌道内の要素であり、誤った結果に大きな影響を及ぼす。本稿では,これらのトークンをロールアウトサンプリングによって識別する新しいフレームワークを提案する。クリティカルトークンの識別と置換がモデル精度を大幅に向上させることを示す。
論文参考訳（メタデータ） (2024-11-29T18:58:22Z)
Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文参考訳（メタデータ） (2024-08-16T19:08:27Z)
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? [1.9116784879310031]
深層強化学習(RL)では、値関数はディープニューラルネットワークを用いて近似され、平均2乗誤差回帰目標を用いて訓練される。近年の研究では、クロスエントロピー分類の目的を活かした代替手法が提案されている。我々の研究は、オフラインのRLセットアップにおけるそのような置換の影響を実証的に調査することを目指している。
論文参考訳（メタデータ） (2024-06-10T14:25:11Z)
Overcoming Pitfalls in Graph Contrastive Learning Evaluation: Toward Comprehensive Benchmarks [60.82579717007963]
本稿では,グラフコントラスト学習(GCL)手法の有効性,一貫性,全体的な能力をより正確に評価するために,拡張された評価フレームワークを提案する。
論文参考訳（メタデータ） (2024-02-24T01:47:56Z)
Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文参考訳（メタデータ） (2023-12-07T18:37:43Z)
A comprehensive theoretical framework for the optimization of neural networks classification performance with respect to weighted metrics [1.0499611180329804]
多くの文脈において、ニューラルネットワークによって実行される予測の良さを評価するために、カスタマイズされた分類スコアと重み付けされた分類スコアが設計されている。我々は、重み付けされた分類指標を形式化し、モデルにこれらの関心を最適化させる損失の構築を可能にする完全な設定を提供する。
論文参考訳（メタデータ） (2023-05-22T20:33:29Z)
Uncertainty Estimation by Fisher Information-based Evidential Deep Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文参考訳（メタデータ） (2023-03-03T16:12:59Z)
Where Should We Begin? A Low-Level Exploration of Weight Initialization Impact on Quantized Behaviour of Deep Neural Networks [93.4221402881609]
異なる重みの初期化が重みの最終的な分布と異なるCNNアーキテクチャの活性化に与える影響について、詳細なアブレーション研究を行う。我々の知る限りでは、ウェイトの初期化とその量子化行動に対する影響について、そのような低レベルで詳細な定量分析を行うのは、私たちは初めてである。
論文参考訳（メタデータ） (2020-11-30T06:54:28Z)
Influence Functions in Deep Learning Are Fragile [52.31375893260445]
影響関数は、テスト時間予測におけるサンプルの効果を近似する。影響評価は浅いネットワークではかなり正確ですヘッセン正則化は、高品質な影響推定を得るために重要である。
論文参考訳（メタデータ） (2020-06-25T18:25:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。