論文の概要: Progressive Hard-case Mining across Pyramid Levels in Object Detection
- arxiv url: http://arxiv.org/abs/2109.07217v1
- Date: Wed, 15 Sep 2021 11:12:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 14:59:58.600659
- Title: Progressive Hard-case Mining across Pyramid Levels in Object Detection
- Title(参考訳): 物体検出におけるピラミッドレベルの進行的ハードケースマイニング
- Authors: Binghong Wu, Yehui Yang, Dalu Yang, Junde Wu, Haifeng Huang, Lei Wang,
Junwei Liu, Yanwu Xu
- Abstract要約: マルチレベル予測と再サンプリングは1段検出器の性能を大幅に改善した。
UMOP(Unified Multi-level Optimization Paradigm)を提案する。
UMOP は,(1) 各ピラミッドレベルを個別に監視する独立した分類損失, 2) ピラミッドレベル全体の損失を,余分なレベルの設定なしで定義する進行的ハードケースマイニング損失の2つの構成要素から構成される。
- 参考スコア(独自算出の注目度): 10.767061690336824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In object detection, multi-level prediction (e.g., FPN, YOLO) and resampling
skills (e.g., focal loss, ATSS) have drastically improved one-stage detector
performance. However, how to improve the performance by optimizing the feature
pyramid level-by-level remains unexplored. We find that, during training, the
ratio of positive over negative samples varies across pyramid levels
(\emph{level imbalance}), which is not addressed by current one-stage
detectors. To mediate the influence of level imbalance, we propose a Unified
Multi-level Optimization Paradigm (UMOP) consisting of two components: 1) an
independent classification loss supervising each pyramid level with individual
resampling considerations; 2) a progressive hard-case mining loss defining all
losses across the pyramid levels without extra level-wise settings. With UMOP
as a plug-and-play scheme, modern one-stage detectors can attain a ~1.5 AP
improvement with fewer training iterations and no additional computation
overhead. Our best model achieves 55.1 AP on COCO test-dev. Code is available
at https://github.com/zimoqingfeng/UMOP.
- Abstract(参考訳): 物体検出では、マルチレベル予測(FPN、YOLOなど)と再サンプリング技術(焦点損失、ATSSなど)が一段検出性能を大幅に改善した。
しかし、機能ピラミッドレベルの最適化によってパフォーマンスを改善する方法はまだ未定である。
トレーニング中、負のサンプルに対する正の比率はピラミッドのレベル (\emph{level imbalance}) によって異なり、これは現在の1段階の検出器では対処されない。
レベル不均衡の影響を仲介するために,2つのコンポーネントからなる統一多レベル最適化パラダイム(UMOP)を提案する。
1) 各ピラミッドレベルを個別のサンプルで監督する独立した分類損失
2) ピラミッドレベル全体の損失を, 余分なレベルの設定を伴わずに, 段階的なハードケース採掘損失が生じた。
UMOPをプラグアンドプレイ方式として、現代のワンステージ検出器は、トレーニングのイテレーションを減らし、計算オーバーヘッドを増やすことなく、1.5APの改善を達成できる。
ベストモデルはCOCOテストデブで55.1 APを達成した。
コードはhttps://github.com/zimoqingfeng/umopで入手できる。
関連論文リスト
- AFPN: Asymptotic Feature Pyramid Network for Object Detection [16.86715579071991]
本稿では,非隣接レベルでの直接対話を支援する機能ピラミッドネットワーク(AFPN)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させ、融合プロセスに高レベル特徴を実現する。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-06-28T07:58:49Z) - Revisiting AP Loss for Dense Object Detection: Adaptive Ranking Pair
Selection [19.940491797959407]
本研究では, 平均精度 (AP) の損失を再考し, その重要な要素は, 正試料と負試料のランキングペアを選択することであることを明らかにした。
本稿では,AP損失を改善するための2つの方法を提案する。第1に,APE(Adaptive Pairwise Error)損失は,正と負の両方のサンプルにおいて,ペアのランク付けに重点を置いている。
MSCOCOデータセットで行った実験は、現在の分類とランキングの損失と比較して、提案手法の優位性を実証し、分析を支援した。
論文 参考訳(メタデータ) (2022-07-25T10:33:06Z) - Planning and Learning with Adaptive Lookahead [74.39132848733847]
ポリシーイテレーション(PI)アルゴリズムは、欲求の一段階の改善と政策評価を交互に行う。
近年の文献では、複数段階のルックアヘッドポリシーの改善が、イテレーション毎の複雑さの増加を犠牲にして、よりコンバージェンス率の向上につながることが示されている。
本研究では,多段階の地平線を状態と推定値の関数として動的に適応する手法を初めて提案する。
論文 参考訳(メタデータ) (2022-01-28T20:26:55Z) - Equalized Focal Loss for Dense Long-Tailed Object Detection [17.89136305755172]
ワンステージ検出器は、簡単にデプロイできるシンプルで高速なパイプラインを持っているため、業界で広く普及している。
本稿では,一段検知器が長期のシナリオで良好に機能するかどうかを考察する。
正および負のサンプルの損失寄与を再均衡させる等化焦点損失(EFL)を提案する。
論文 参考訳(メタデータ) (2022-01-07T18:35:58Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。