論文の概要: SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment
- arxiv url: http://arxiv.org/abs/2203.00862v1
- Date: Wed, 2 Mar 2022 04:24:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-03 14:43:38.891853
- Title: SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment
- Title(参考訳): SEA: セマンティックアライメントによる1段と2段の検出器蒸留のギャップを埋める
- Authors: Yixin Chen, Zhuotao Tian, Pengguang Chen, Shu Liu, Jiaya Jia
- Abstract要約: 細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
- 参考スコア(独自算出の注目度): 76.80165589520385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We revisit the one- and two-stage detector distillation tasks and present a
simple and efficient semantic-aware framework to fill the gap between them. We
address the pixel-level imbalance problem by designing the category anchor to
produce a representative pattern for each category and regularize the
topological distance between pixels and category anchors to further tighten
their semantic bonds. We name our method SEA (SEmantic-aware Alignment)
distillation given the nature of abstracting dense fine-grained information by
semantic reliance to well facilitate distillation efficacy. SEA is well adapted
to either detection pipeline and achieves new state-of-the-art results on the
challenging COCO object detection task on both one- and two-stage detectors.
Its superior performance on instance segmentation further manifests the
generalization ability. Both 2x-distilled RetinaNet and FCOS with ResNet50-FPN
outperform their corresponding 3x ResNet101-FPN teacher, arriving 40.64 and
43.06 AP, respectively. Code will be made publicly available.
- Abstract(参考訳): 我々は,1段および2段の検出器蒸留作業を再考し,それらのギャップを埋めるためのシンプルで効率的な意味認識フレームワークを提案する。
カテゴリアンカーを設計し,各カテゴリの代表パターンを生成し,各カテゴリアンカーとカテゴリアンカー間の位相的距離を規則化し,セマンティック結合をさらに強化することで,画素レベルの不均衡問題に対処する。
我々は, 密集した細粒度情報をセマンティック・リライアンスによって抽象化し, 蒸留効果を高める性質から, sea(semantic-aware alignment)蒸留法と命名する。
SEAは、いずれの検知パイプラインにも適合しており、1段と2段の検出器のCOCOオブジェクト検出タスクにおいて、新しい最先端の結果を達成する。
インスタンスセグメンテーションにおける優れたパフォーマンスは、さらに一般化能力を示す。
ResNet50-FPNの2x蒸留されたRetinaNetとFCOSは、それぞれ40.64 APと43.06 APの3x ResNet101-FPNの教師より優れていた。
コードは公開される予定だ。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - PETDet: Proposal Enhancement for Two-Stage Fine-Grained Object Detection [26.843891792018447]
PETDet (Proposal Enhancement for Two-stage fine-fine object detection) は, 2段階FGOD法において, サブタスクをよりよく扱うために提案される。
動的ラベル割り当てと注意に基づく分解により, アンカーフリー品質指向提案ネットワーク(QOPN)を提案する。
A novel Adaptive Recognition Loss (ARL)は、R-CNNの責任者が高品質な提案に焦点を合わせるためのガイダンスを提供する。
論文 参考訳(メタデータ) (2023-12-16T18:04:56Z) - Adversarial Score Distillation: When score distillation meets GAN [3.2794321281011394]
既存のスコア蒸留をWGAN(Wasserstein Generative Adversarial Network)パラダイムで解読する。
WGANのパラダイムでは、既存のスコア蒸留は固定された準最適判別器を使うか、不完全判別器の最適化を行うかのいずれかである。
本稿では、最適な判別器を維持し、完全な最適化目標を用いて更新するASD(Adversarial Score Distillation)を提案する。
論文 参考訳(メタデータ) (2023-12-01T17:20:47Z) - G-DetKD: Towards General Distillation Framework for Object Detectors via
Contrastive and Semantic-guided Feature Imitation [49.421099172544196]
そこで本研究では,すべてのピラミッドレベルにまたがる特徴ペア間のソフトマッチングを自動的に行う,意味誘導型特徴模倣手法を提案する。
また,異なる特徴領域間の関係で符号化された情報を効果的に捉えるために,コントラスト蒸留を導入する。
本手法は,(1)フレームワークのコンポーネントを別々に使用した場合に,既存の検出KD技術よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-08-17T07:44:27Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection [8.39479809973967]
Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
論文 参考訳(メタデータ) (2020-11-30T10:21:32Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。