論文の概要: AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2011.14667v2
- Date: Mon, 19 Apr 2021 07:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 14:46:39.528157
- Title: AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection
- Title(参考訳): AFD-Net:Few-Shotオブジェクト検出のための適応フルデュアルネットワーク
- Authors: Longyao Liu, Bo Ma, Yulin Zhang, Xin Yi, Haozhi Li
- Abstract要約: Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
- 参考スコア(独自算出の注目度): 8.39479809973967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) aims at learning a detector that can fast
adapt to previously unseen objects with scarce annotated examples, which is
challenging and demanding. Existing methods solve this problem by performing
subtasks of classification and localization utilizing a shared component (e.g.,
RoI head) in the detector, yet few of them take the distinct preferences of two
subtasks towards feature embedding into consideration. In this paper, we
carefully analyze the characteristics of FSOD, and present that a general
few-shot detector should consider the explicit decomposition of two subtasks,
as well as leveraging information from both of them to enhance feature
representations. To the end, we propose a simple yet effective Adaptive
Fully-Dual Network (AFD-Net). Specifically, we extend Faster R-CNN by
introducing Dual Query Encoder and Dual Attention Generator for separate
feature extraction, and Dual Aggregator for separate model reweighting.
Spontaneously, separate state estimation is achieved by the R-CNN detector.
Besides, for the acquisition of enhanced feature representations, we further
introduce Adaptive Fusion Mechanism to adaptively perform feature fusion in
different subtasks. Extensive experiments on PASCAL VOC and MS COCO in various
settings show that, our method achieves new state-of-the-art performance by a
large margin, demonstrating its effectiveness and generalization ability.
- Abstract(参考訳): Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器を学習することを目的としている。
既存の手法では、検出器内の共有コンポーネント(roiヘッドなど)を利用して分類と局所化のサブタスクを実行するが、2つのサブタスクの異なる好みを考慮に入れることは少ない。
本稿では,FSODの特性を慎重に解析し,2つのサブタスクの明示的な分解を考慮すべきであることを示す。
最後に, 単純で効果的な適応完全双対ネットワーク (AFD-Net) を提案する。
具体的には,分離特徴抽出のためのデュアルクエリエンコーダとデュアルアテンション生成器,分離モデル重み付けのためのデュアルアグリゲータを導入することで,r-cnnを高速化した。
自然にR-CNN検出器によって別々の状態推定が達成される。
また,機能表現の強化のために,異なるサブタスクで機能融合を適応的に行うための適応的融合機構も導入する。
PASCAL VOCとMS COCOの多種多様な環境下での大規模実験により,本手法は新たな最先端性能を大きなマージンで達成し,その有効性と一般化能力を示した。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - AMFD: Distillation via Adaptive Multimodal Fusion for Multispectral Pedestrian Detection [23.91870504363899]
マルチスペクトル検出におけるダブルストリームネットワークは、マルチモーダルデータに2つの異なる特徴抽出枝を用いる。
これにより、組み込みデバイスにおける多スペクトル歩行者検出が自律システムに広く採用されるのを妨げている。
本稿では,教師ネットワークの本来のモーダル特徴を完全に活用できる適応型モーダル核融合蒸留(AMFD)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2024-05-21T17:17:17Z) - PETDet: Proposal Enhancement for Two-Stage Fine-Grained Object Detection [26.843891792018447]
PETDet (Proposal Enhancement for Two-stage fine-fine object detection) は, 2段階FGOD法において, サブタスクをよりよく扱うために提案される。
動的ラベル割り当てと注意に基づく分解により, アンカーフリー品質指向提案ネットワーク(QOPN)を提案する。
A novel Adaptive Recognition Loss (ARL)は、R-CNNの責任者が高品質な提案に焦点を合わせるためのガイダンスを提供する。
論文 参考訳(メタデータ) (2023-12-16T18:04:56Z) - A Dual Attentive Generative Adversarial Network for Remote Sensing Image
Change Detection [6.906936669510404]
本稿では,高分解能なリモートセンシング画像変化検出タスクを実現するために,二重注意生成対向ネットワークを提案する。
DAGANフレームワークは、85.01%がIoU、91.48%がF1スコアであり、LEVIRデータセットの先進的な手法よりもパフォーマンスが良い。
論文 参考訳(メタデータ) (2023-10-03T08:26:27Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。
提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文 参考訳(メタデータ) (2020-12-09T08:16:35Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。