論文の概要: FeatAug-DETR: Enriching One-to-Many Matching for DETRs with Feature
Augmentation
- arxiv url: http://arxiv.org/abs/2303.01503v1
- Date: Thu, 2 Mar 2023 18:59:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 12:51:26.885884
- Title: FeatAug-DETR: Enriching One-to-Many Matching for DETRs with Feature
Augmentation
- Title(参考訳): FeatAug-DETR:機能拡張によるDETRの1対1マッチング強化
- Authors: Rongyao Fang, Peng Gao, Aojun Zhou, Yingjie Cai, Si Liu, Jifeng Dai,
Hongsheng Li
- Abstract要約: 1対1のマッチングは、DETRのようなオブジェクト検出フレームワークにおいて重要な設計である。
画像や画像の特徴を拡大する異なる視点から一対一マッチングを実現する2つの手法を提案する。
提案手法の有効性を評価するため, 広範囲な実験を行った。
- 参考スコア(独自算出の注目度): 48.94488166162821
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: One-to-one matching is a crucial design in DETR-like object detection
frameworks. It enables the DETR to perform end-to-end detection. However, it
also faces challenges of lacking positive sample supervision and slow
convergence speed. Several recent works proposed the one-to-many matching
mechanism to accelerate training and boost detection performance. We revisit
these methods and model them in a unified format of augmenting the object
queries. In this paper, we propose two methods that realize one-to-many
matching from a different perspective of augmenting images or image features.
The first method is One-to-many Matching via Data Augmentation (denoted as
DataAug-DETR). It spatially transforms the images and includes multiple
augmented versions of each image in the same training batch. Such a simple
augmentation strategy already achieves one-to-many matching and surprisingly
improves DETR's performance. The second method is One-to-many matching via
Feature Augmentation (denoted as FeatAug-DETR). Unlike DataAug-DETR, it
augments the image features instead of the original images and includes
multiple augmented features in the same batch to realize one-to-many matching.
FeatAug-DETR significantly accelerates DETR training and boosts detection
performance while keeping the inference speed unchanged. We conduct extensive
experiments to evaluate the effectiveness of the proposed approach on DETR
variants, including DAB-DETR, Deformable-DETR, and H-Deformable-DETR. Without
extra training data, FeatAug-DETR shortens the training convergence periods of
Deformable-DETR to 24 epochs and achieves 58.3 AP on COCO val2017 set with
Swin-L as the backbone.
- Abstract(参考訳): 1対1のマッチングは、DETRのようなオブジェクト検出フレームワークにおいて重要な設計である。
これにより、DETRはエンドツーエンド検出を行うことができる。
しかし、ポジティブなサンプル監視や収束速度の遅い問題にも直面している。
いくつかの最近の研究で、トレーニングを加速し、検出性能を向上する1対1のマッチング機構が提案されている。
我々は、これらのメソッドを再検討し、オブジェクトクエリを補完する統一フォーマットでモデル化する。
本稿では,画像や画像の特徴の異なる視点から一対多マッチングを実現する2つの手法を提案する。
最初の方法は、データ拡張(dataaug-detr)による1対1のマッチングである。
空間的に画像を変換し、同じトレーニングバッチで各イメージの複数の拡張バージョンを含む。
このような単純な拡張戦略はすでに1対1のマッチングを実現しており、DETRの性能は驚くほど向上している。
第2の方法は、機能拡張(feataug-detr)による1対1のマッチングである。
DataAug-DETRとは異なり、元のイメージの代わりにイメージ機能を拡張し、同じバッチに複数の拡張機能を備え、ワンツーマンマッチングを実現する。
FeatAug-DETRはDETRトレーニングを著しく加速し、推論速度を一定に保ちながら検出性能を向上させる。
我々は,DAB-DETR,Deformable-DETR,H-Deformable-DETRなど,提案手法の有効性を評価するための広範囲な実験を行った。
FeatAug-DETRは追加のトレーニングデータなしで、Deformable-DETRのトレーニング収束期間を24時間に短縮し、Swin-LをバックボーンとするCOCO val2017上で58.3 APを達成した。
関連論文リスト
- MS-DETR: Efficient DETR Training with Mixed Supervision [74.93329653526952]
MS-DETRは、推論に使用されるプライマリデコーダのオブジェクトクエリを1対1で監視する。
このアプローチではデコーダのブランチやオブジェクトクエリを追加する必要はありません。
実験結果から,本手法はDETRの変種よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-08T16:08:53Z) - Semantic-Aligned Matching for Enhanced DETR Convergence and Multi-Scale
Feature Fusion [95.7732308775325]
提案したDetection TRansformer (DETR) は、オブジェクト検出のための完全なエンドツーエンドパラダイムを確立している。
DETRは遅いトレーニング収束に悩まされており、様々な検出タスクの適用性を妨げている。
我々は,DETRの収束を加速し,検出性能を向上させるためにセマンティック・アラインド・マッチDreTR++を設計する。
論文 参考訳(メタデータ) (2022-07-28T15:34:29Z) - Group DETR: Fast DETR Training with Group-Wise One-to-Many Assignment [80.55064790937092]
複数の予測に1つの基幹オブジェクトを割り当てる1対多の割り当ては、より高速なR-CNNやFCOSのような検出方法に成功している。
グループDETR(Group DETR)は、単純だが効率的なDECRトレーニング手法であり、一対多の割り当てのためのグループワイドな方法を導入する。
実験により、グループDETRはトレーニング収束を著しく高速化し、様々なDETRモデルの性能を向上させることが示された。
論文 参考訳(メタデータ) (2022-07-26T17:57:58Z) - DETRs with Hybrid Matching [21.63116788914251]
1対1のセットマッチングは、DETRがエンドツーエンドの機能を確立するための鍵となる設計である。
本稿では,従来の1対1のマッチングブランチと,トレーニング中に補助的な1対1のマッチングブランチを組み合わせるハイブリッドマッチング方式を提案する。
論文 参考訳(メタデータ) (2022-07-26T17:52:14Z) - Accelerating DETR Convergence via Semantic-Aligned Matching [50.3633635846255]
本稿では,DTRの精度を犠牲にすることなく,DTRの収束を大幅に加速するセマンティック整合DTRであるSAM-DETRを提案する。
意味整合性マッチングにおいて最も識別性の高い特徴を持つ有能な点を明示的に検索し、収束をさらに高速化し、検出精度も向上する。
論文 参考訳(メタデータ) (2022-03-14T06:50:51Z) - Recurrent Glimpse-based Decoder for Detection with Transformer [85.64521612986456]
本稿では,Recurrent Glimpse-based deoder (REGO)について紹介する。
特に、REGOは多段階のリカレント処理構造を用いて、DETRの注目が徐々に前景オブジェクトに焦点を合わせるのを助ける。
REGOは、異なるDETR検出器の性能を最大7%向上させる。
論文 参考訳(メタデータ) (2021-12-09T00:29:19Z) - SamplingAug: On the Importance of Patch Sampling Augmentation for Single
Image Super-Resolution [28.089781316522284]
本稿では,画像訓練のための簡易かつ効果的なデータ拡張法を提案する。
まず,各パッチペアの重要度を評価する指標を考案する。
すべてのパッチペアの計算コストを削減するために,積分画像による計算の最適化を提案する。
論文 参考訳(メタデータ) (2021-11-30T07:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。