論文の概要: Dynamic Head: Unifying Object Detection Heads with Attentions
- arxiv url: http://arxiv.org/abs/2106.08322v1
- Date: Tue, 15 Jun 2021 17:55:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 16:45:04.594732
- Title: Dynamic Head: Unifying Object Detection Heads with Attentions
- Title(参考訳): dynamic head: オブジェクト検出ヘッドを注意して統一する
- Authors: Xiyang Dai, Yinpeng Chen, Bin Xiao, Dongdong Chen, Mengchen Liu, Lu
Yuan, Lei Zhang
- Abstract要約: 本稿では,オブジェクト検出ヘッドと注意を一体化するための新しい動的ヘッドフレームワークを提案する。
標準のResNeXt-101-DCNバックボーンでは、一般的な物体検出器よりも性能が大幅に向上し、54.0 APで新しい最先端を実現する。
- 参考スコア(独自算出の注目度): 46.726061894005056
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complex nature of combining localization and classification in object
detection has resulted in the flourished development of methods. Previous works
tried to improve the performance in various object detection heads but failed
to present a unified view. In this paper, we present a novel dynamic head
framework to unify object detection heads with attentions. By coherently
combining multiple self-attention mechanisms between feature levels for
scale-awareness, among spatial locations for spatial-awareness, and within
output channels for task-awareness, the proposed approach significantly
improves the representation ability of object detection heads without any
computational overhead. Further experiments demonstrate that the effectiveness
and efficiency of the proposed dynamic head on the COCO benchmark. With a
standard ResNeXt-101-DCN backbone, we largely improve the performance over
popular object detectors and achieve a new state-of-the-art at 54.0 AP.
Furthermore, with latest transformer backbone and extra data, we can push
current best COCO result to a new record at 60.6 AP. The code will be released
at https://github.com/microsoft/DynamicHead.
- Abstract(参考訳): 物体検出における局所化と分類の組み合わせによる複雑な性質は、手法の発達に発展をもたらした。
以前の作業では、様々な物体検出ヘッドの性能向上を試みたが、統一されたビューを提示できなかった。
本稿では,オブジェクト検出ヘッドを注意をもって統一する新しい動的ヘッドフレームワークを提案する。
空間認識のための空間的位置とタスク認識のための出力チャネルの間で、スケール認識のための特徴レベル間の複数の自己認識機構をコヒーレントに結合することにより、提案手法は、計算オーバーヘッドなしにオブジェクト検出ヘッドの表現能力を大幅に向上させる。
さらなる実験により,COCOベンチマークにおける動的ヘッドの有効性と効率が示された。
標準のResNeXt-101-DCNバックボーンでは、一般的な物体検出器よりも性能が大幅に向上し、54.0 APで新しい最先端を実現する。
さらに、最新のトランスフォーマーバックボーンと余分なデータにより、現在の最高のCOCO結果を60.6 APで新しいレコードにプッシュすることができる。
コードはhttps://github.com/microsoft/dynamicheadでリリースされる。
関連論文リスト
- Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - Detecting Every Object from Events [24.58024539462497]
本稿では,イベントベースの視覚において,クラスに依存しない高速なオープンワールドオブジェクト検出を実現するためのアプローチとして,イベント中のすべてのオブジェクトの検出(DEOE)を提案する。
私たちのコードはhttps://github.com/Hatins/DEOEで公開されています。
論文 参考訳(メタデータ) (2024-04-08T08:20:53Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - D2Q-DETR: Decoupling and Dynamic Queries for Oriented Object Detection
with Transformers [14.488821968433834]
オブジェクト指向オブジェクト検出のためのエンドツーエンドフレームワークを提案する。
我々のフレームワークはDETRに基づいており、ボックスレグレッションヘッドはポイント予測ヘッドに置き換えられている。
最大かつ挑戦的なDOTA-v1.0データセットとDOTA-v1.5データセットの実験は、D2Q-DETRが既存のNMSベースおよびNMSのないオブジェクト指向オブジェクト検出方法より優れていることを示している。
論文 参考訳(メタデータ) (2023-03-01T14:36:19Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。