論文の概要: DEYOv2: Rank Feature with Greedy Matching for End-to-End Object
Detection
- arxiv url: http://arxiv.org/abs/2306.09165v1
- Date: Thu, 15 Jun 2023 14:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 14:25:34.554562
- Title: DEYOv2: Rank Feature with Greedy Matching for End-to-End Object
Detection
- Title(参考訳): DEYOv2: エンドツーエンドオブジェクト検出のためのグレディマッチング付きランク機能
- Authors: Haodong Ouyang
- Abstract要約: 本稿では,第1世代のDEYOモデルの改良版であるDEYOv2を提案する。
モデルトレーニングを加速し、パフォーマンスを高めるために、プログレッシブな推論アプローチを採用している。
私たちの知る限りでは、DEYOv2は古典的な検出器とクエリベースの検出器のそれぞれの強度を組み合わせた、最初の完全なエンドツーエンドのオブジェクト検出器である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel object detector called DEYOv2, an improved
version of the first-generation DEYO (DETR with YOLO) model. DEYOv2, similar to
its predecessor, DEYOv2 employs a progressive reasoning approach to accelerate
model training and enhance performance. The study delves into the limitations
of one-to-one matching in optimization and proposes solutions to effectively
address the issue, such as Rank Feature and Greedy Matching. This approach
enables the third stage of DEYOv2 to maximize information acquisition from the
first and second stages without needing NMS, achieving end-to-end optimization.
By combining dense queries, sparse queries, one-to-many matching, and
one-to-one matching, DEYOv2 leverages the advantages of each method. It
outperforms all existing query-based end-to-end detectors under the same
settings. When using ResNet-50 as the backbone and multi-scale features on the
COCO dataset, DEYOv2 achieves 51.1 AP and 51.8 AP in 12 and 24 epochs,
respectively. Compared to the end-to-end model DINO, DEYOv2 provides
significant performance gains of 2.1 AP and 1.4 AP in the two epoch settings.
To the best of our knowledge, DEYOv2 is the first fully end-to-end object
detector that combines the respective strengths of classical detectors and
query-based detectors.
- Abstract(参考訳): 本稿では,第1世代DEYO(DETR with YOLO)モデルの改良版であるDEYOv2を提案する。
DEYOv2は前任のDEYOv2と同様、モデルトレーニングの加速と性能向上のために進歩的な推論手法を採用している。
この研究は、最適化における1対1マッチングの限界を掘り下げ、ランク特徴やグリーディマッチングといった問題に効果的に取り組むソリューションを提案する。
このアプローチにより、DEYOv2の第3段階は、NMSを必要とせずに、第1段階と第2段階からの情報取得を最大化し、エンドツーエンドの最適化を実現することができる。
密度の高いクエリ、スパースクエリ、ワンツーマンマッチング、ワンツーマンマッチングを組み合わせることで、DEYOv2は各メソッドの利点を活用する。
既存のクエリベースのエンドツーエンド検出を、同じ設定ですべて上回る。
COCOデータセットのバックボーンとマルチスケール機能としてResNet-50を使用する場合、DeYOv2はそれぞれ51.1 APと51.8 APを12時間と24時間で達成している。
エンドツーエンドモデルであるDINOと比較して、DEYOv2は2つのエポック設定で2.1 APと1.4 APの大幅なパフォーマンス向上を提供する。
私たちの知る限りでは、DEYOv2は古典的な検出器とクエリベースの検出器のそれぞれの強度を組み合わせた、最初の完全なエンドツーエンドのオブジェクト検出器である。
関連論文リスト
- E2E-MFD: Towards End-to-End Synchronous Multimodal Fusion Detection [21.185032466325737]
マルチモーダル核融合検出のための新しいエンドツーエンドアルゴリズムであるE2E-MFDを紹介する。
E2E-MFDはプロセスの合理化を図り、単一のトレーニングフェーズで高いパフォーマンスを達成する。
複数の公開データセットに対する広範なテストは、E2E-MFDの優れた機能を明らかにします。
論文 参考訳(メタデータ) (2024-03-14T12:12:17Z) - DEYO: DETR with YOLO for Step-by-Step Object Detection [0.0]
本稿では, YOLO (DEYO) を用いた新しい2段階物体検出モデルDETRを提案する。
第1ステージは高品質なクエリと第2ステージへのアンカー供給を提供し、オリジナルのDETRモデルと比較して第2ステージの性能と効率を改善した。
実験の結果、DEYOは12時間で50.6 AP、52.1 AP、36時間でそれぞれ到達した。
論文 参考訳(メタデータ) (2022-11-12T06:36:17Z) - YOLO-Pose: Enhancing YOLO for Multi Person Pose Estimation Using Object
Keypoint Similarity Loss [1.3381749415517017]
YOLO-poseは関節検出と2次元多人数ポーズ推定のための新しいヒートマップのないアプローチである。
私たちのフレームワークは、モデルのエンドツーエンドのトレーニングを可能にし、オブジェクトキーポイント類似度(OKS)メトリクス自体を最適化します。
YOLO-poseはCOCO検証(90.2% AP50)とテストデフセット(90.3% AP50)の新たな最先端結果を達成する
論文 参考訳(メタデータ) (2022-04-14T08:02:40Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - AFDetV2: Rethinking the Necessity of the Second Stage for Object
Detection from Point Clouds [15.72821609622122]
我々は点雲からの3次元検出のための1段アンカーフリーネットワークを開発した。
我々は、バックボーンの自己校正畳み込みブロック、キーポイント補助監視、マルチタスクヘッドのIoU予測分岐を使用する。
私たちは2021年のリアルタイム3Dチャレンジで1位を獲得しました。
論文 参考訳(メタデータ) (2021-12-16T21:22:17Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - Corner Proposal Network for Anchor-free, Two-stage Object Detection [174.59360147041673]
オブジェクト検出の目標は、画像内のオブジェクトのクラスと位置を決定することである。
本稿では,多数のオブジェクト提案を抽出する新しいアンカーフリー2段階フレームワークを提案する。
この2つの段階が,リコールと精度の向上に有効な解であることを示す。
論文 参考訳(メタデータ) (2020-07-27T19:04:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。