論文の概要: Visual Detector Compression via Location-Aware Discriminant Analysis
- arxiv url: http://arxiv.org/abs/2509.17968v1
- Date: Mon, 22 Sep 2025 16:19:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.494495
- Title: Visual Detector Compression via Location-Aware Discriminant Analysis
- Title(参考訳): 位置認識識別分析によるビジュアルディテクタ圧縮
- Authors: Qizhen Lan, Jung Im Choi, Qing Tian,
- Abstract要約: 本稿では,深部視覚検出のための能動的検出識別器を用いたネットワーク圧縮手法を提案する。
私たちのアプローチは、複雑さを大幅に減らして、元のベースモデルを上回ることさえ可能です。
- 参考スコア(独自算出の注目度): 1.0773370323095608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks are powerful, yet their high complexity greatly limits their potential to be deployed on billions of resource-constrained edge devices. Pruning is a crucial network compression technique, yet most existing methods focus on classification models, with limited attention to detection. Even among those addressing detection, there is a lack of utilization of essential localization information. Also, many pruning methods passively rely on pre-trained models, in which useful and useless components are intertwined, making it difficult to remove the latter without harming the former at the neuron/filter level. To address the above issues, in this paper, we propose a proactive detection-discriminants-based network compression approach for deep visual detectors, which alternates between two steps: (1) maximizing and compressing detection-related discriminants and aligning them with a subset of neurons/filters immediately before the detection head, and (2) tracing the detection-related discriminating power across the layers and discarding features of lower importance. Object location information is exploited in both steps. Extensive experiments, employing four advanced detection models and four state-of-the-art competing methods on the KITTI and COCO datasets, highlight the superiority of our approach. Remarkably, our compressed models can even beat the original base models with a substantial reduction in complexity.
- Abstract(参考訳): ディープニューラルネットワークは強力だが、その高い複雑さは、数十億のリソース制約されたエッジデバイスにデプロイされる可能性を大幅に制限する。
プルーニングは重要なネットワーク圧縮技術であるが、既存のほとんどの手法は分類モデルに重点を置いており、検出に限定している。
これらの検出方法の中でも,本質的なローカライゼーション情報の利用が欠如している。
また、多くのプルーニング法は、有益で無益な部品が絡み合う事前訓練されたモデルに受動的に依存しており、前者を傷つけることなく後者を除去することが困難である。
以上の課題に対処するため,本研究では,(1)検出関連識別物質を最大化・圧縮し,検出ヘッドの直前にニューロン/フィルタのサブセットと整列させ,(2)検出関連識別パワーの層間追跡と,より重要度の高い特徴の排除という2つのステップを交互に行う,深部視覚検出器のための能動的検出識別型ネットワーク圧縮手法を提案する。
オブジェクトの位置情報は両方のステップで利用されます。
4つの高度な検出モデルと4つの最先端の競合手法をKITTIとCOCOデータセットに適用した大規模な実験により、我々のアプローチの優位性を強調した。
注目すべきは、圧縮されたモデルは、複雑さを大幅に減らしてオリジナルのベースモデルに勝てることです。
関連論文リスト
- A Low-cost Strategic Monitoring Approach for Scalable and Interpretable
Error Detection in Deep Neural Networks [6.537257913467249]
深層コンピュータビジョンネットワークのための高能率ランタイムモニタリング手法を提案する。
ハードウェアメモリと入力障害の両方から発生するサイレントデータの破損を効率よく検出することができる。
論文 参考訳(メタデータ) (2023-10-31T10:45:55Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Hyperbolic Self-supervised Contrastive Learning Based Network Anomaly
Detection [0.0]
属性ネットワーク上の異常検出は近年,多くの研究分野において注目されている。
双曲型自己教師付きコントラスト学習を用いた効率的な異常検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-12T07:08:34Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z) - Video Anomaly Detection Using Pre-Trained Deep Convolutional Neural Nets
and Context Mining [2.0646127669654835]
本稿では,事前学習した畳み込みニューラルネットモデルを用いて特徴抽出とコンテキストマイニングを行う方法について述べる。
我々は,高レベルの特徴から文脈特性を導出し,ビデオ異常検出法の性能をさらに向上させる。
論文 参考訳(メタデータ) (2020-10-06T00:26:14Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。