論文の概要: FQDet: Fast-converging Query-based Detector
- arxiv url: http://arxiv.org/abs/2210.02318v1
- Date: Wed, 5 Oct 2022 15:19:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:18:57.307786
- Title: FQDet: Fast-converging Query-based Detector
- Title(参考訳): FQDet: 高速収束クエリベースの検出器
- Authors: C\'edric Picron, Punarjay Chakravarty, Tinne Tuytelaars
- Abstract要約: 最近、Deformable DETRはクエリベースの2段ヘッドを導入した。これは、地域ベースの古典的検出器の2段ヘッドとは異なる新しいタイプの2段ヘッドである。
本研究では,Deformable DETRからクエリベースのヘッドをさらに改良し,コンバージェンスを大幅に高速化し,性能を向上する。
これは、クエリベースのパラダイムにアンカー生成のような古典的なテクニックを組み込むことによって実現される。
- 参考スコア(独自算出の注目度): 41.15635648489346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, two-stage Deformable DETR introduced the query-based two-stage
head, a new type of two-stage head different from the region-based two-stage
heads of classical detectors as Faster R-CNN. In query-based two-stage heads,
the second stage selects one feature per detection, called the query, as
opposed to pooling a rectangular grid of features as in region-based detectors.
In this work, we further improve the query-based head from Deformable DETR,
significantly speeding up the convergence while increasing its performance.
This is achieved by incorporating classical techniques such as anchor
generation within the query-based paradigm. By combining the best of both the
classical and the query-based worlds, our FQDet head peaks at 45.4 AP on the
2017 COCO validation set when using a ResNet-50+TPN backbone, only after
training for 12 epochs using the 1x schedule. We outperform other
high-performing two-stage heads such as e.g. Cascade R-CNN, while using the
same backbone and while often being computationally cheaper. Additionally, when
using the large ResNeXt-101-DCN+TPN backbone and multi-scale testing, our FQDet
head achieves 52.9 AP on the 2017 COCO test-dev set after only 12 epochs of
training. Code will be released.
- Abstract(参考訳): 最近、Deformable DETRはクエリベースの2段ヘッドを導入した。これは、地域ベースの古典検出器の2段ヘッドとは異なる新しいタイプの2段ヘッドである。
クエリベースの2ステージヘッドでは、第2ステージは、領域ベースの検出器のように長方形の特徴のグリッドをプールするのとは対照的に、クエリと呼ばれる1つの検出機能を選択する。
本研究では,Deformable DETRからクエリベースのヘッドをさらに改善し,コンバージェンスを大幅に高速化し,性能を向上する。
これはクエリベースのパラダイムにアンカー生成のような古典的なテクニックを取り入れることで実現されている。
古典的およびクエリベースの世界の長所を組み合わせることで、2017年のCOCOバリデーションセットでFQDetのピークは45.4 APであり、ResNet-50+TPNバックボーンを使用しており、1xスケジュールを使用して12のエポックをトレーニングした後のみである。
我々は、カスケードR-CNNのような他の高性能な2段ヘッドよりも、同じバックボーンを使用しながら、計算的に安価であることが多い。
さらに、大規模なResNeXt-101-DCN+TPNバックボーンとマルチスケールテストを使用する場合、トレーニング12時間後の2017 COCO test-devセットで、FQDetヘッドは52.9 APを達成した。
コードはリリースされる。
関連論文リスト
- Self-Balanced R-CNN for Instance Segmentation [2.059150828428537]
インスタンスセグメンテーションタスクにおける現在の最先端の2段階モデルは、いくつかのタイプの不均衡に悩まされている。
本稿では、第2段階のトレーニングにおいて、利益の正の入力領域(RoIs)のユニオン(IoU)分布不均衡について述べる。
我々のセルフバランスR-CNNモデルは、バウンディングボックスとマスクリファインメントの全く新しいループメカニズムを提供する。
論文 参考訳(メタデータ) (2024-04-25T14:22:44Z) - Salience DETR: Enhancing Detection Transformer with Hierarchical Salience Filtering Refinement [19.277560848076984]
2段階の選択戦略は、選択したクエリとオブジェクトのミスマッチによるスケールバイアスと冗長性をもたらす。
本稿では,フィルタされた識別クエリのみにトランスフォーマーを符号化する階層型サリエンスフィルタリング精細化を提案する。
提案されたSalience DETRは、課題固有の3つのデータセットに対して、+4.0% AP、+0.2% AP、+4.4% APを大幅に改善する。
論文 参考訳(メタデータ) (2024-03-24T13:01:57Z) - Detection Transformer with Stable Matching [48.963171068785435]
もっとも重要な設計は, 肯定的な事例の分類スコアを監督するために, 位置測定値のみを使用することである。
本原理では,DTRの分類損失とマッチングコストに位置測定値を統合することで,簡易かつ効果的な2つの修正を提案する。
12エポックおよび24エポックのトレーニング設定の下でResNet-50バックボーンを用いてCOCO検出ベンチマークで50.4および51.5APを達成する。
論文 参考訳(メタデータ) (2023-04-10T17:55:37Z) - Dense Distinct Query for End-to-End Object Detection [39.32011383066249]
オブジェクト検出における1対1の割り当ては、非最大抑制の必要性を回避した。
本稿では,Dense Distinct Queries (DDQ) の解法について述べる。
DDQは従来のエンドツーエンド検出器と最近のエンド・ツー・エンド検出器の利点をブレンドし、様々な検出器の性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-03-22T17:42:22Z) - Featurized Query R-CNN [41.40318163261041]
本稿では,より高速なR-CNNフレームワークにおいて,クエリ生成ネットワークによって予測されるオブジェクトクエリについて述べる。
我々のFaturized Query R-CNNは、最新の技術であるスパースR-CNN検出器を含むすべてのR-CNN検出器の中で、最高の速度精度のトレードオフを得る。
論文 参考訳(メタデータ) (2022-06-13T15:40:19Z) - DAB-DETR: Dynamic Anchor Boxes are Better Queries for DETR [37.61768722607528]
DeTR(Detection TRansformer)のための動的アンカーボックスを用いた新しいクエリ定式化を提案する。
この新たな定式化は、Transformerデコーダのクエリとしてボックス座標を直接使用し、層ごとに動的に更新する。
MS-COCOベンチマークでは、同じ設定でDETRライクな検出モデルの中で最高のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2022-01-28T18:51:09Z) - Recurrent Glimpse-based Decoder for Detection with Transformer [85.64521612986456]
本稿では,Recurrent Glimpse-based deoder (REGO)について紹介する。
特に、REGOは多段階のリカレント処理構造を用いて、DETRの注目が徐々に前景オブジェクトに焦点を合わせるのを助ける。
REGOは、異なるDETR検出器の性能を最大7%向上させる。
論文 参考訳(メタデータ) (2021-12-09T00:29:19Z) - KG-FiD: Infusing Knowledge Graph in Fusion-in-Decoder for Open-Domain
Question Answering [68.00631278030627]
検索した通路間の構造的関係を知識グラフで利用することにより,ノイズのある通路をフィルタする新しい手法KG-FiDを提案する。
我々は,KG-FiDが解答一致スコアの最大1.5%向上し,計算コストの40%程度でFiDに匹敵する性能が得られることを示した。
論文 参考訳(メタデータ) (2021-10-08T18:39:59Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。