論文の概要: Cascade-DETR: Delving into High-Quality Universal Object Detection
- arxiv url: http://arxiv.org/abs/2307.11035v1
- Date: Thu, 20 Jul 2023 17:11:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 11:47:43.358656
- Title: Cascade-DETR: Delving into High-Quality Universal Object Detection
- Title(参考訳): Cascade-DETR: 高品質なユニバーサルオブジェクト検出
- Authors: Mingqiao Ye, Lei Ke, Siyuan Li, Yu-Wing Tai, Chi-Keung Tang, Martin
Danelljan and Fisher Yu
- Abstract要約: 高品質な普遍物体検出のためのカスケードDETRを提案する。
本稿では,オブジェクト中心情報を検出デコーダに明示的に統合するカスケードアテンション層を提案する。
最後に、多様なドメインから10のデータセットを含む汎用オブジェクト検出ベンチマークUDB10を紹介する。
- 参考スコア(独自算出の注目度): 99.62131881419143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object localization in general environments is a fundamental part of vision
systems. While dominating on the COCO benchmark, recent Transformer-based
detection methods are not competitive in diverse domains. Moreover, these
methods still struggle to very accurately estimate the object bounding boxes in
complex environments.
We introduce Cascade-DETR for high-quality universal object detection. We
jointly tackle the generalization to diverse domains and localization accuracy
by proposing the Cascade Attention layer, which explicitly integrates
object-centric information into the detection decoder by limiting the attention
to the previous box prediction. To further enhance accuracy, we also revisit
the scoring of queries. Instead of relying on classification scores, we predict
the expected IoU of the query, leading to substantially more well-calibrated
confidences. Lastly, we introduce a universal object detection benchmark,
UDB10, that contains 10 datasets from diverse domains. While also advancing the
state-of-the-art on COCO, Cascade-DETR substantially improves DETR-based
detectors on all datasets in UDB10, even by over 10 mAP in some cases. The
improvements under stringent quality requirements are even more pronounced. Our
code and models will be released at https://github.com/SysCV/cascade-detr.
- Abstract(参考訳): 一般的な環境でのオブジェクトのローカライゼーションは、視覚システムの基本部分である。
COCOベンチマークで優位に立つ一方で、最近のTransformerベースの検出方法は多様なドメインで競合しない。
さらに、これらの手法は複雑な環境でオブジェクトバウンディングボックスを正確に推定するのに苦労している。
高品質な普遍物体検出のためのカスケードDETRを提案する。
本稿では,対象中心情報を検出デコーダに明示的に統合するカスケード・アテンション・レイヤを提案することにより,多様な領域への一般化と局所化精度を両立させる。
さらに精度を高めるために,クエリのスコアリングを再検討する。
分類スコアに頼る代わりに、クエリの予想されるiouを予測することで、信頼性が大幅に向上します。
最後に、多様なドメインから10のデータセットを含む汎用オブジェクト検出ベンチマークUDB10を紹介する。
カスケード-DETRはCOCOの最先端を推し進める一方で、UDB10の全データセット上のDETRベースの検出器を大幅に改善している。
厳密な品質要件による改善はさらに顕著である。
私たちのコードとモデルはhttps://github.com/syscv/cascade-detrでリリースされる予定です。
関連論文リスト
- Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - DETR with Additional Global Aggregation for Cross-domain Weakly
Supervised Object Detection [34.14603473160207]
本稿では,クロスドメイン弱教師付き物体検出(CDWSOD)のためのDETRに基づく手法を提案する。
我々は、DETR のエンコーダとデコーダはどちらもアテンション機構に基づいており、CDWSOD の可能性が強いと考えている。
集約結果、すなわち画像レベルの予測は、ドメインアライメントの弱い監督を自然に利用することができる。
論文 参考訳(メタデータ) (2023-04-14T12:16:42Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - VarifocalNet: An IoU-aware Dense Object Detector [11.580759212782812]
我々は、物体の存在感と位置決め精度の合同表現として、IACS(Iou-Aware Classification Score)を学習する。
IACSに基づいて、高密度物体検出器により、より正確な候補検出のランク付けが可能であることを示す。
FCOS+ATSSアーキテクチャに基づくIoU対応の高密度物体検出器を構築し,VarifocalNetあるいはVFNetと呼ぶ。
論文 参考訳(メタデータ) (2020-08-31T05:12:21Z) - Dynamic Refinement Network for Oriented and Densely Packed Object
Detection [75.29088991850958]
本稿では,機能選択モジュール (FSM) と動的改善ヘッド (DRH) の2つの新しいコンポーネントからなる動的精細化ネットワークを提案する。
我々のFSMは、ニューロンがターゲットオブジェクトの形状や向きに応じて受容野を調整できるのに対して、DRHはオブジェクト認識の方法で動的に予測を洗練させる。
我々は、DOTA、HRSC2016、SKU110K、および我々のSKU110K-Rデータセットを含むいくつかの公開ベンチマークで定量的評価を行う。
論文 参考訳(メタデータ) (2020-05-20T11:35:50Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。