論文の概要: Inlier-Centric Post-Training Quantization for Object Detection Models
- arxiv url: http://arxiv.org/abs/2602.03472v1
- Date: Tue, 03 Feb 2026 12:44:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.449166
- Title: Inlier-Centric Post-Training Quantization for Object Detection Models
- Title(参考訳): 物体検出モデルのためのインレーヤ中心後の量子化
- Authors: Minsu Kim, Dongyeun Lee, Jaemyung Yu, Jiwan Hur, Giseop Kim, Junmo Kim,
- Abstract要約: 学習後の量子化手法であるInlierQを提案する。
InlierQは、勾配のボリュームサリエンシスコアを計算し、各ボリュームをイリヤまたは異常として分類し、これらのスコアの後方分布に適合する。
COCOとnuScenesベンチマークの実験では、カメラベース(2Dと3D)とLiDARベース(3D)オブジェクト検出の量子化誤差が一貫した減少を示した。
- 参考スコア(独自算出の注目度): 18.823590340914205
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object detection is pivotal in computer vision, yet its immense computational demands make deployment slow and power-hungry, motivating quantization. However, task-irrelevant morphologies such as background clutter and sensor noise induce redundant activations (or anomalies). These anomalies expand activation ranges and skew activation distributions toward task-irrelevant responses, complicating bit allocation and weakening the preservation of informative features. Without a clear criterion to distinguish anomalies, suppressing them can inadvertently discard useful information. To address this, we present InlierQ, an inlier-centric post-training quantization approach that separates anomalies from informative inliers. InlierQ computes gradient-aware volume saliency scores, classifies each volume as an inlier or anomaly, and fits a posterior distribution over these scores using the Expectation-Maximization (EM) algorithm. This design suppresses anomalies while preserving informative features. InlierQ is label-free, drop-in, and requires only 64 calibration samples. Experiments on the COCO and nuScenes benchmarks show consistent reductions in quantization error for camera-based (2D and 3D) and LiDAR-based (3D) object detection.
- Abstract(参考訳): 物体検出はコンピュータビジョンにおいて重要であるが、その膨大な計算要求は、展開を遅くし、電力を消費し、量子化を動機付けている。
しかし、背景クラッタやセンサノイズなどのタスク非関連形態は、冗長なアクティベーション(または異常)を引き起こす。
これらの異常は、アクティベーション範囲を拡大し、タスク非関連応答に対するスキューアクティベーション分布を拡大し、ビット割り当てを複雑化し、情報的特徴の保存を弱める。
異常を区別するための明確な基準がなければ、それらを抑えることは、必然的に有用な情報を捨てる可能性がある。
これを解決するために、情報的不整合から異常を分離する不整合中心のポストトレーニング量子化手法InlierQを提案する。
InlierQは、勾配対応ボリュームサリエンシスコアを計算し、各ボリュームをイリヤまたは異常として分類し、期待最大化(EM)アルゴリズムを用いてこれらのスコアの後方分布に適合する。
この設計は、情報的特徴を保持しながら異常を抑制する。
InlierQはラベルなし、ドロップインで、64個のキャリブレーションサンプルしか必要としない。
COCOとnuScenesベンチマークの実験では、カメラベース(2Dと3D)とLiDARベース(3D)オブジェクト検出の量子化誤差が一貫した減少を示した。
関連論文リスト
- Registration is a Powerful Rotation-Invariance Learner for 3D Anomaly Detection [64.0168648353038]
ポイントクラウドデータにおける3次元異常検出は、高い信頼性で構造欠陥を特定することを目的として、産業品質管理に不可欠である。
現在のメモリバンクベースの手法は、しばしば一貫性のない特徴変換と限定的な識別能力に悩まされる。
本稿では、ポイントクラウド登録とメモリベース異常検出の目的を統合した、登録による回転不変の特徴抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-19T14:56:38Z) - Autoregressive Denoising Score Matching is a Good Video Anomaly Detector [36.96911195723131]
ビデオ異常検出(VAD)はコンピュータビジョンの重要な問題である。
雑音条件付きスコア変換器を導入し、スコアマッチングを復調する。
次に,シーン依存型,動き認識型スコア関数を提案する。
我々は、新しい自己回帰型聴覚スコアマッチング機構を介して、影響を受けない視覚情報を統合する。
論文 参考訳(メタデータ) (2025-06-29T15:14:32Z) - Towards Zero-shot 3D Anomaly Localization [58.62650061201283]
3DzALは3D異常検出とローカライゼーションのためのパッチレベルの新しいコントラスト学習フレームワークである。
3DzALは最先端の異常検出および局所化性能より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-05T16:25:27Z) - Diff3DETR:Agent-based Diffusion Model for Semi-supervised 3D Object Detection [33.58208166717537]
3次元物体検出は3次元シーンの理解に不可欠である。
半教師付き手法の最近の発展は、教師による学習フレームワークを用いて、未ラベルの点群に対する擬似ラベルを生成することにより、この問題を緩和しようとしている。
半教師付き3次元物体検出のためのエージェントベース拡散モデル(Diff3DETR)を提案する。
論文 参考訳(メタデータ) (2024-08-01T05:04:22Z) - Lossy Compression for Robust Unsupervised Time-Series Anomaly Detection [4.873362301533825]
本稿では,異常検出のためのLossy Causal Temporal Convolutional Neural Network Autoencoderを提案する。
我々のフレームワークは, 速度歪み損失とエントロピーボトルネックを用いて, タスクの圧縮潜在表現を学習する。
論文 参考訳(メタデータ) (2022-12-05T14:29:16Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - SLA$^2$P: Self-supervised Anomaly Detection with Adversarial
Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。
本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文 参考訳(メタデータ) (2021-11-25T03:53:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。