論文の概要: Towards Better Object Detection in Scale Variation with Adaptive Feature
Selection
- arxiv url: http://arxiv.org/abs/2012.03265v2
- Date: Wed, 9 Dec 2020 13:43:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 06:10:50.614159
- Title: Towards Better Object Detection in Scale Variation with Adaptive Feature
Selection
- Title(参考訳): 適応的特徴選択を用いたスケール変動における物体検出の改善
- Authors: Zehui Gong, Dong Li
- Abstract要約: チャネル次元の多レベル表現を融合する方法を自動学習する新しい適応的特徴選択モジュール(AFSM)を提案する。
これは、特徴ピラミッド構造を持つ検出器の性能を著しく向上させる。
クラス不均衡問題に対処するために,クラス対応サンプリング機構(CASM)を提案する。
- 参考スコア(独自算出の注目度): 3.5352273012717044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is a common practice to exploit pyramidal feature representation to tackle
the problem of scale variation in object instances. However, most of them still
predict the objects in a certain range of scales based solely or mainly on a
single-level representation, yielding inferior detection performance. To this
end, we propose a novel adaptive feature selection module (AFSM), to
automatically learn the way to fuse multi-level representations in the channel
dimension, in a data-driven manner. It significantly improves the performance
of the detectors that have a feature pyramid structure, while introducing
nearly free inference overhead. Moreover, a class-aware sampling mechanism
(CASM) is proposed to tackle the class imbalance problem, by re-weighting the
sampling ratio to each of the training images, based on the statistical
characteristics of each class. This is crucial to improve the performance of
the minor classes. Experimental results demonstrate the effectiveness of the
proposed method, with 83.04% mAP at 15.96 FPS on the VOC dataset, and 39.48% AP
on the VisDrone-DET validation subset, respectively, outperforming other
state-of-the-art detectors considerably. The code is available at
https://github.com/ZeHuiGong/AFSM.git.
- Abstract(参考訳): ピラミッド型特徴表現を利用して、オブジェクトインスタンスのスケール変動の問題に取り組むのが一般的である。
しかし、それらのほとんどは、単独または主にシングルレベルの表現に基づいて、一定の範囲のスケールでオブジェクトを予測し、検出性能が劣る。
そこで本研究では,チャネル次元におけるマルチレベル表現の融合をデータ駆動方式で自動学習する適応的特徴選択モジュール(afsm)を提案する。
これは特徴ピラミッド構造を持つ検出器の性能を大幅に改善し、ほとんど自由な推論オーバーヘッドを導入した。
さらに,各授業の統計特性に基づいて,各トレーニング画像に対するサンプリング比率を再重み付けすることにより,クラス不均衡問題に対処するためのクラス認識サンプリング機構(CASM)を提案する。
これはマイナークラスのパフォーマンスを改善するために重要です。
実験の結果,VOCデータセットでは83.04% mAPが15.96 FPS,VisDrone-DET検証サブセットでは39.48%,他の最先端検出器では39.48%であった。
コードはhttps://github.com/ZeHuiGong/AFSM.gitで入手できる。
関連論文リスト
- Hierarchical Side-Tuning for Vision Transformers [34.55731467838914]
本稿では,種々の下流タスクへのVT転送を効果的に行う新しいPETL手法である階層側チューニング(HST)を提案する。
HSTを検証するために,分類,オブジェクト検出,インスタンスセグメンテーション,セマンティックセグメンテーションなど,多様な視覚的タスクを含む広範な実験を行った。
VTAB-1kでは,0.78Mパラメータを微調整しながら,最先端の平均Top-1精度76.4%を実現した。
論文 参考訳(メタデータ) (2023-10-09T04:16:35Z) - HardVis: Visual Analytics to Handle Instance Hardness Using
Undersampling and Oversampling Techniques [74.09665819220567]
HardVisは、主に不均衡な分類シナリオでインスタンスの硬さを処理するために設計されたビジュアル分析システムである。
ユーザはさまざまな視点からデータのサブセットを探索して、これらのパラメータをすべて決定できる。
HardVisの有効性と有効性は仮説的利用シナリオとユースケースで実証される。
論文 参考訳(メタデータ) (2022-03-29T17:04:16Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z) - Beyond Simple Meta-Learning: Multi-Purpose Models for Multi-Domain,
Active and Continual Few-Shot Learning [41.07029317930986]
低ラベル方式で動作するモデルの分散感応クラスを提案する。
最初の手法であるSimple CNAPSは階層的に正規化されたマハラノビス距離に基づく分類器を用いる。
我々はさらに、このアプローチをトランスダクティブ学習環境に拡張し、トランスダクティブCNAPSを提案する。
論文 参考訳(メタデータ) (2022-01-13T18:59:02Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。