論文の概要: Selective Multi-Scale Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2206.08206v1
- Date: Thu, 16 Jun 2022 14:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 23:44:37.764107
- Title: Selective Multi-Scale Learning for Object Detection
- Title(参考訳): オブジェクト検出のための選択型マルチスケール学習
- Authors: Junliang Chen, Weizeng Lu, Linlin Shen
- Abstract要約: RetinaNetとSMSLを組み合わせると、COCOデータセットのAP(39.1%から40.9%)が1.8%改善される。
SMSLと統合すると、2段検出器はAPを1.0%改善できる。
- 参考スコア(独自算出の注目度): 35.08958597150306
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pyramidal networks are standard methods for multi-scale object detection.
Current researches on feature pyramid networks usually adopt layer connections
to collect features from certain levels of the feature hierarchy, and do not
consider the significant differences among them. We propose a better
architecture of feature pyramid networks, named selective multi-scale learning
(SMSL), to address this issue. SMSL is efficient and general, which can be
integrated in both single-stage and two-stage detectors to boost detection
performance, with nearly no extra inference cost. RetinaNet combined with SMSL
obtains 1.8\% improvement in AP (from 39.1\% to 40.9\%) on COCO dataset. When
integrated with SMSL, two-stage detectors can get around 1.0\% improvement in
AP.
- Abstract(参考訳): ピラミッドネットワークは、マルチスケールオブジェクト検出の標準手法である。
機能ピラミッドネットワークに関する現在の研究は、通常、機能階層の特定のレベルから機能を集めるためにレイヤ接続を採用しており、それらの大きな違いを考慮していない。
この問題に対処するために,選択型マルチスケール学習(SMSL)と呼ばれる特徴ピラミッドネットワークのアーキテクチャを提案する。
SMSLは効率的で汎用的であり、単段検出器と二段検出器の両方に統合して検出性能を向上させることができる。
RetinaNetとSMSLを組み合わせると、COCOデータセットのAP(39.1\%から40.9\%)が1.8.%向上する。
SMSLと統合すると、2段検出器はAPの約1.0倍の改善が得られる。
関連論文リスト
- Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Extending One-Stage Detection with Open-World Proposals [8.492340530784697]
完全畳み込み型一段検出ネットワークFCOSは,新しい授業で最大6%のOWP性能を向上できることを示す。
新たな授業では2段階の手法が6%悪くなったが,共同でOWPと分類を最適化した場合,FCOSは2%しか低下しないことがわかった。
論文 参考訳(メタデータ) (2022-01-07T02:29:09Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Learning to Generate Content-Aware Dynamic Detectors [62.74209921174237]
サンプル適応型モデルアーキテクチャを自動的に生成する効率的な検出器の設計を新たに導入する。
動的ルーティングの学習を導くために、オブジェクト検出に適したコースツーファインの成層図を紹介します。
MS-COCOデータセットの実験により、CADDetはバニラルーティングに比べて10%少ないFLOPで1.8以上のmAPを達成することが示された。
論文 参考訳(メタデータ) (2020-12-08T08:05:20Z) - Dual Refinement Feature Pyramid Networks for Object Detection [2.88935873409577]
FPNは、オブジェクト検出器で使われる一般的なコンポーネントであり、隣り合うレベルの特徴と和によって、マルチスケール情報を補う。
本稿では,画素レベルと特徴マップレベルから設計欠陥を解析する。
本研究では,パラメータフリーな特徴ピラミッドネットワークであるDual Refinement Feature Pyramid Networksを設計した。
論文 参考訳(メタデータ) (2020-12-03T07:17:03Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - A novel Region of Interest Extraction Layer for Instance Segmentation [3.5493798890908104]
本稿では,既存のRoI抽出器の限界を克服する必要性を動機とする。
提案するレイヤ(Generic RoI Extractor - GRoIE)には,非ローカルなビルディングブロックとアテンション機構が導入され,パフォーマンスが向上する。
GRoIEは、オブジェクト検出とインスタンスセグメンテーションの両方のために、すべての2段階アーキテクチャとシームレスに統合できる。
論文 参考訳(メタデータ) (2020-04-28T17:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。