論文の概要: MimicDet: Bridging the Gap Between One-Stage and Two-Stage Object
Detection
- arxiv url: http://arxiv.org/abs/2009.11528v1
- Date: Thu, 24 Sep 2020 07:36:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 04:58:51.142212
- Title: MimicDet: Bridging the Gap Between One-Stage and Two-Stage Object
Detection
- Title(参考訳): mimicdet: 1段階と2段階のオブジェクト検出のギャップを埋める
- Authors: Xin Lu, Quanquan Li, Buyu Li, Junjie Yan
- Abstract要約: 1段の検出器は、単純なアーキテクチャのためより効率的だが、2段の検出器は依然として精度でリードしている。
2段階特徴を直接模倣して1段階検出器を訓練する新しいフレームワークであるMimicDetを提案する。
マイクロメソッドは1段と2段の検出器で共有されたバックボーンを持ち、それから2つのヘッドに分岐する。
- 参考スコア(独自算出の注目度): 65.74032877197844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern object detection methods can be divided into one-stage approaches and
two-stage ones. One-stage detectors are more efficient owing to straightforward
architectures, but the two-stage detectors still take the lead in accuracy.
Although recent work try to improve the one-stage detectors by imitating the
structural design of the two-stage ones, the accuracy gap is still significant.
In this paper, we propose MimicDet, a novel and efficient framework to train a
one-stage detector by directly mimic the two-stage features, aiming to bridge
the accuracy gap between one-stage and two-stage detectors. Unlike conventional
mimic methods, MimicDet has a shared backbone for one-stage and two-stage
detectors, then it branches into two heads which are well designed to have
compatible features for mimicking. Thus MimicDet can be end-to-end trained
without the pre-train of the teacher network. And the cost does not increase
much, which makes it practical to adopt large networks as backbones. We also
make several specialized designs such as dual-path mimicking and staggered
feature pyramid to facilitate the mimicking process. Experiments on the
challenging COCO detection benchmark demonstrate the effectiveness of MimicDet.
It achieves 46.1 mAP with ResNeXt-101 backbone on the COCO test-dev set, which
significantly surpasses current state-of-the-art methods.
- Abstract(参考訳): 現代の物体検出法は1段階のアプローチと2段階のアプローチに分けることができる。
単段検出器は、単純な構造のため効率が良いが、2段検出器は精度が良い。
最近の研究は、2段の構造設計を模倣して1段検出器の改良を試みているが、精度の差は依然として大きい。
本稿では,一段検出器と二段検出器の精度ギャップを埋めることを目的として,二段特徴を直接模倣して一段検出器を訓練する新しい,効率的なフレームワークであるMimicDetを提案する。
従来の模倣方法とは異なり、MimicDetは1段と2段の検出器で共有されたバックボーンを持ち、それから2つのヘッドに分岐する。
したがって、ミメデットは教師ネットワークの事前訓練なしにエンドツーエンドで訓練することができる。
コストもそれほど高くないため,大規模なネットワークをバックボーンとして採用することは現実的だ。
また, 模倣処理を容易にするために, デュアルパス模倣, スタッガー特徴ピラミッドなどの特殊設計もいくつか用意した。
挑戦的coco検出ベンチマーク実験はミソデットの有効性を示す。
COCO test-dev セットの ResNeXt-101 バックボーンで46.1 mAP を実現し、現在の最先端手法を大きく上回っている。
関連論文リスト
- Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - Can the Query-based Object Detector Be Designed with Fewer Stages? [15.726619371300558]
GOLOと呼ばれる2段階のデコードパラダイムに従う新しいモデルを提案する。
マルチステージデコーダを用いた他の主流クエリベースモデルと比較すると,デコーダのステージは少なく,性能は高い。
論文 参考訳(メタデータ) (2023-09-28T09:58:52Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Towards Discriminative and Transferable One-Stage Few-Shot Object
Detectors [3.9189402702217344]
Few-shot Object Detection (FSOD) は、少数のサンプルを与えられた新しいクラスを学習することでこの問題に対処することを目的としている。
2段と1段のFSODの性能差は, 主に識別性の弱いためである。
これらの制約に対処するため,高密度メタ検出器のための前景サンプル数を増大させるマルチウェイサポートトレーニング戦略であるFew-shot RetinaNet(FSRN)を提案する。
論文 参考訳(メタデータ) (2022-10-11T20:58:25Z) - Road detection via a dual-task network based on cross-layer graph fusion
modules [2.8197257696982287]
道路検出のためのデュアルタスクネットワーク(DTnet)と層間グラフ融合モジュール(CGM)を提案する。
CGMは複雑な特徴ストリームグラフによる層間融合効果を改善し、4つのグラフパターンを評価した。
論文 参考訳(メタデータ) (2022-08-17T07:16:55Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - Mining the Benefits of Two-stage and One-stage HOI Detection [26.919979955155664]
2段階の手法は、数年にわたって人-物体相互作用(HOI)の検出を支配してきた。
1段階の手法は、マルチタスク学習、すなわちオブジェクト検出と相互作用分類において適切なトレードオフを行うことが困難である。
本稿では,カスケード方式で人物体検出と相互作用分類を両立させる新しい一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-11T07:38:09Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - Probabilistic two-stage detection [83.9604523643406]
現状の1段階検出器から2段階の確率的検出器を構築する方法を示す。
その結果、検出器は1段と2段の両方の前駆体よりも高速で精度が高い。
論文 参考訳(メタデータ) (2021-03-12T18:56:17Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。