論文の概要: D2Q-DETR: Decoupling and Dynamic Queries for Oriented Object Detection
with Transformers
- arxiv url: http://arxiv.org/abs/2303.00542v1
- Date: Wed, 1 Mar 2023 14:36:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-02 14:30:34.953593
- Title: D2Q-DETR: Decoupling and Dynamic Queries for Oriented Object Detection
with Transformers
- Title(参考訳): d2q-detr:トランスフォーマーを用いた指向オブジェクト検出のためのデカップリングと動的クエリ
- Authors: Qiang Zhou, Chaohui Yu, Zhibin Wang, Fan Wang
- Abstract要約: オブジェクト指向オブジェクト検出のためのエンドツーエンドフレームワークを提案する。
我々のフレームワークはDETRに基づいており、ボックスレグレッションヘッドはポイント予測ヘッドに置き換えられている。
最大かつ挑戦的なDOTA-v1.0データセットとDOTA-v1.5データセットの実験は、D2Q-DETRが既存のNMSベースおよびNMSのないオブジェクト指向オブジェクト検出方法より優れていることを示している。
- 参考スコア(独自算出の注目度): 14.488821968433834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the promising results, existing oriented object detection methods
usually involve heuristically designed rules, e.g., RRoI generation, rotated
NMS. In this paper, we propose an end-to-end framework for oriented object
detection, which simplifies the model pipeline and obtains superior
performance. Our framework is based on DETR, with the box regression head
replaced with a points prediction head. The learning of points is more
flexible, and the distribution of points can reflect the angle and size of the
target rotated box. We further propose to decouple the query features into
classification and regression features, which significantly improves the model
precision. Aerial images usually contain thousands of instances. To better
balance model precision and efficiency, we propose a novel dynamic query
design, which reduces the number of object queries in stacked decoder layers
without sacrificing model performance. Finally, we rethink the label assignment
strategy of existing DETR-like detectors and propose an effective label
re-assignment strategy for improved performance. We name our method D2Q-DETR.
Experiments on the largest and challenging DOTA-v1.0 and DOTA-v1.5 datasets
show that D2Q-DETR outperforms existing NMS-based and NMS-free oriented object
detection methods and achieves the new state-of-the-art.
- Abstract(参考訳): 有望な結果にもかかわらず、既存のオブジェクト指向オブジェクト検出手法は、通常、RRoI生成や回転NMSといったヒューリスティックに設計された規則を含む。
本稿では,モデルパイプラインを単純化し,優れた性能を得る指向オブジェクト検出のためのエンドツーエンドフレームワークを提案する。
我々のフレームワークはDETRに基づいており、ボックス回帰ヘッドはポイント予測ヘッドに置き換えられている。
点の学習はより柔軟であり、点の分布はターゲットの回転箱の角度と大きさを反映することができる。
さらに,クエリ機能を分類と回帰に分離し,モデルの精度を大幅に向上させることを提案する。
航空画像は通常数千のインスタンスを含む。
モデルの精度と効率のバランスを改善するために,モデル性能を犠牲にすることなく,積み重ねデコーダ層におけるオブジェクトクエリ数を削減できる新しい動的クエリ設計を提案する。
最後に,既存のdetr型検出器のラベル割当戦略を再考し,性能向上のための効果的なラベル割当戦略を提案する。
D2Q-DETRと命名する。
最大かつ挑戦的なDOTA-v1.0データセットとDOTA-v1.5データセットの実験は、D2Q-DETRが既存のNMSベースおよびNMSフリーのオブジェクト指向オブジェクト検出方法より優れており、新しい最先端技術を実現していることを示している。
関連論文リスト
- SEED: A Simple and Effective 3D DETR in Point Clouds [72.74016394325675]
ポイントクラウドの分散度が高く,不均一な分布のため,主な課題は困難である,と我々は主張する。
点雲から3次元物体を検出するための簡便で効果的な3次元DETR法(SEED)を提案する。
論文 参考訳(メタデータ) (2024-07-15T14:21:07Z) - DQ-DETR: DETR with Dynamic Query for Tiny Object Detection [29.559819542066236]
DQ-DETRは3つの異なるコンポーネントから構成される。
DQ-DETRは、カテゴリカウントモジュールからの予測と密度マップを使用して、オブジェクトクエリの数を動的に調整する。
我々のモデルは、AI-TOD-V2データセット上で最先端のmAPを30.2%達成し、従来のCNNベースおよびDETRライクな手法より優れている。
論文 参考訳(メタデータ) (2024-04-04T15:10:24Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - DEYO: DETR with YOLO for Step-by-Step Object Detection [0.0]
本稿では, YOLO (DEYO) を用いた新しい2段階物体検出モデルDETRを提案する。
第1ステージは高品質なクエリと第2ステージへのアンカー供給を提供し、オリジナルのDETRモデルと比較して第2ステージの性能と効率を改善した。
実験の結果、DEYOは12時間で50.6 AP、52.1 AP、36時間でそれぞれ到達した。
論文 参考訳(メタデータ) (2022-11-12T06:36:17Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z) - Dynamic Refinement Network for Oriented and Densely Packed Object
Detection [75.29088991850958]
本稿では,機能選択モジュール (FSM) と動的改善ヘッド (DRH) の2つの新しいコンポーネントからなる動的精細化ネットワークを提案する。
我々のFSMは、ニューロンがターゲットオブジェクトの形状や向きに応じて受容野を調整できるのに対して、DRHはオブジェクト認識の方法で動的に予測を洗練させる。
我々は、DOTA、HRSC2016、SKU110K、および我々のSKU110K-Rデータセットを含むいくつかの公開ベンチマークで定量的評価を行う。
論文 参考訳(メタデータ) (2020-05-20T11:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。