論文の概要: AO2-DETR: Arbitrary-Oriented Object Detection Transformer
- arxiv url: http://arxiv.org/abs/2205.12785v1
- Date: Wed, 25 May 2022 13:57:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-26 15:13:16.167883
- Title: AO2-DETR: Arbitrary-Oriented Object Detection Transformer
- Title(参考訳): AO2-DETR:任意指向物体検出変換器
- Authors: Linhui Dai, Hong Liu, Hao Tang, Zhiwei Wu, Pinhao Song
- Abstract要約: 本稿では、AO2-DETRと呼ばれるArbitrary-Oriented Object Detection TRansformerフレームワークを提案する。
指向的提案を明示的に生成するために、指向的提案生成機構を提案する。
また、直接セット予測のための1対1マッチングプロセスを保証するために、回転対応セットマッチング損失を用いる。
- 参考スコア(独自算出の注目度): 17.287517988299925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arbitrary-oriented object detection (AOOD) is a challenging task to detect
objects in the wild with arbitrary orientations and cluttered arrangements.
Existing approaches are mainly based on anchor-based boxes or dense points,
which rely on complicated hand-designed processing steps and inductive bias,
such as anchor generation, transformation, and non-maximum suppression
reasoning. Recently, the emerging transformer-based approaches view object
detection as a direct set prediction problem that effectively removes the need
for hand-designed components and inductive biases. In this paper, we propose an
Arbitrary-Oriented Object DEtection TRansformer framework, termed AO2-DETR,
which comprises three dedicated components. More precisely, an oriented
proposal generation mechanism is proposed to explicitly generate oriented
proposals, which provides better positional priors for pooling features to
modulate the cross-attention in the transformer decoder. An adaptive oriented
proposal refinement module is introduced to extract rotation-invariant region
features and eliminate the misalignment between region features and objects.
And a rotation-aware set matching loss is used to ensure the one-to-one
matching process for direct set prediction without duplicate predictions. Our
method considerably simplifies the overall pipeline and presents a new AOOD
paradigm. Comprehensive experiments on several challenging datasets show that
our method achieves superior performance on the AOOD task.
- Abstract(参考訳): 任意指向オブジェクト検出(aood)は、任意の方向と乱雑な配置で野生のオブジェクトを検出するための困難なタスクである。
既存のアプローチは主にアンカーベースボックスや高密度点に基づいており、これは複雑な手設計の処理ステップと、アンカー生成、変換、非最大抑圧推論のような誘導バイアスに依存している。
近年,新しいトランスフォーマティブ・アプローチでは,オブジェクト検出を,手作りのコンポーネントや帰納バイアスを効果的に排除する直接集合予測問題として捉えている。
本稿では、3つの専用コンポーネントからなるAO2-DETRと呼ばれるArbitrary-Oriented Object Detection TRansformerフレームワークを提案する。
より正確には、変換器デコーダのクロスアテンションを変調するために、プール機能に対してより優れた位置先を付与する、指向性提案を明示的に生成する指向性提案生成機構を提案する。
回転不変な領域特徴を抽出し、領域特徴と対象物とのミスアライメントを除去する適応指向型提案改良モジュールを導入する。
また、重複予測を伴わずに、直接セット予測のための1対1のマッチングプロセスを確保するために、回転対応のセットマッチング損失を用いる。
本手法はパイプライン全体を大幅に単純化し,新しいAOODパラダイムを提案する。
いくつかの挑戦的データセットに対する総合的な実験により,本手法はAOODタスクにおいて優れた性能を発揮することが示された。
関連論文リスト
- Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - SeqCo-DETR: Sequence Consistency Training for Self-Supervised Object
Detection with Transformers [18.803007408124156]
本稿では,SeqCo-DETRを提案する。SeqCo-DETR,SeqCo-DETR,SeqCo-DETR,SeqCo-DETR,SeqCo-DETR,SeqCo-DETR,SeqCo-DETR,Sequence Consistency-based self-supervised method for object DEtection with TRansformersを提案する。
提案手法は,MS COCO (45.8 AP) とPASCAL VOC (64.1 AP) の最先端化を実現し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-03-15T09:36:58Z) - ARS-DETR: Aspect Ratio-Sensitive Detection Transformer for Aerial Oriented Object Detection [55.291579862817656]
既存のオブジェクト指向オブジェクト検出手法では、モデルの性能を測定するために計量AP$_50$が一般的である。
我々は、AP$_50$は本来、角度偏差に大きな耐性があるため、オブジェクト指向物体検出には適さないと主張している。
本稿では,ARS-DETR(Aspect Ratio Sensitive Oriented Object Detector with Transformer)を提案する。
論文 参考訳(メタデータ) (2023-03-09T02:20:56Z) - Miti-DETR: Object Detection based on Transformers with Mitigatory
Self-Attention Convergence [17.854940064699985]
本稿では,緩和的自己認識機構を備えたトランスフォーマーアーキテクチャを提案する。
Miti-DETRは、各注意層の入力をそのレイヤの出力に予約し、「非注意」情報が注意伝播に関与するようにします。
Miti-DETRは、既存のDETRモデルに対する平均検出精度と収束速度を大幅に向上させる。
論文 参考訳(メタデータ) (2021-12-26T03:23:59Z) - A General Gaussian Heatmap Labeling for Arbitrary-Oriented Object
Detection [11.954992010840833]
正の候補を定義するために、アンカーフリーなオブジェクト適応ラベル割り当て(OLA)戦略が提示される。
OBBを表すために、オブジェクト指向バウンディングボックス(OBB)表現コンポーネント(ORC)が開発された。
領域正規化と動的信頼度重み付けを併用した共同最適化損失(JOL)は、誤った最適結果を洗練するために設計されている。
論文 参考訳(メタデータ) (2021-09-27T07:46:09Z) - Oriented Object Detection with Transformer [51.634913687632604]
我々は,エンドツーエンドネットワークに基づくTRansformer(bf O2DETR$)によるオブジェクト指向オブジェクト検出を実装した。
注意機構を奥行き分離可能な畳み込みに置き換えることで,トランスフォーマーの簡易かつ高効率なエンコーダを設計する。
私たちの$rm O2DETR$は、オブジェクト指向オブジェクト検出の分野における別の新しいベンチマークになり、より高速なR-CNNとRetinaNetに対して最大3.85mAPの改善が達成されます。
論文 参考訳(メタデータ) (2021-06-06T14:57:17Z) - Relaxed Transformer Decoders for Direct Action Proposal Generation [30.516462193231888]
本稿では、直接アクション提案生成のためのシンプルでエンドツーエンドの学習可能なフレームワーク(RTD-Net)を提案する。
時間と空間の視覚的相違に対処するため、元の変換器検出フレームワーク(DETR)に対して3つの重要な改善を行った。
THUMOS14とActivityNet-1.3ベンチマークの実験では、RTD-Netの有効性が示されている。
論文 参考訳(メタデータ) (2021-02-03T06:29:28Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection [8.39479809973967]
Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
論文 参考訳(メタデータ) (2020-11-30T10:21:32Z) - Rethinking Transformer-based Set Prediction for Object Detection [57.7208561353529]
実験の結果,提案手法は元のDETRよりもはるかに高速に収束するだけでなく,検出精度の点でDTRや他のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2020-11-21T21:59:42Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。