論文の概要: Hausdorff Distance Matching with Adaptive Query Denoising for Rotated
Detection Transformer
- arxiv url: http://arxiv.org/abs/2305.07598v4
- Date: Wed, 29 Nov 2023 08:56:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-01 01:05:35.950001
- Title: Hausdorff Distance Matching with Adaptive Query Denoising for Rotated
Detection Transformer
- Title(参考訳): 回転検出変圧器の適応的問合せによるハウスドルフ距離マッチング
- Authors: Hakjin Lee, Minki Song, Jamyoung Koo, Junghoon Seo
- Abstract要約: 回転物体検出におけるDETRの適用は、確立された指向性物体検出器と比較して、最適以下の性能を示す。
ハンガリーのマッチングに対するハウスドルフ距離に基づくコストを導入し、予測と地上の真実との相違をより正確に定量化する。
本稿では,モデル改善に寄与しない過剰なノイズクエリを選択的にフィルタリングするために,ハンガリー語マッチングを用いた適応型クエリ記述手法を提案する。
- 参考スコア(独自算出の注目度): 4.519754139322585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Detection Transformer (DETR) has emerged as a pivotal role in object
detection tasks, setting new performance benchmarks due to its end-to-end
design and scalability. Despite its advancements, the application of DETR in
detecting rotated objects has demonstrated suboptimal performance relative to
established oriented object detectors. Our analysis identifies a key
limitation: the L1 cost used in Hungarian Matching leads to duplicate
predictions due to the square-like problem in oriented object detection,
thereby obstructing the training process of the detector. We introduce a
Hausdorff distance-based cost for Hungarian matching, which more accurately
quantifies the discrepancy between predictions and ground truths. Moreover, we
note that a static denoising approach hampers the training of rotated DETR,
particularly when the detector's predictions surpass the quality of noised
ground truths. We propose an adaptive query denoising technique, employing
Hungarian matching to selectively filter out superfluous noised queries that no
longer contribute to model improvement. Our proposed modifications to DETR have
resulted in superior performance, surpassing previous rotated DETR models and
other alternatives. This is evidenced by our model's state-of-the-art
achievements in benchmarks such as DOTA-v1.0/v1.5/v2.0, and DIOR-R.
- Abstract(参考訳): Detection Transformer (DETR) はオブジェクト検出タスクにおいて重要な役割を担い、エンドツーエンドの設計とスケーラビリティのために新しいパフォーマンスベンチマークを設定している。
その進歩にもかかわらず、回転物体検出におけるdetrの応用は、確立された向き付け物体検出器に対する準最適性能を示している。
ハンガリーマッチングに使用されるl1コストは、向き付け対象検出における正方形問題による予測の重複につながるため、検出器のトレーニングプロセスが阻害される。
ハンガリーマッチングのためのハウスドルフ距離ベースのコストを導入し、予測と基底真理の差をより正確に定量化する。
さらに, 静的デノナイジング手法は, 特に検出器の予測がノイズのある地上の真実の質を超えた場合, 回転DETRの訓練を妨げている。
本稿では,ハンガリーマッチングを用いた適応的問合せ手法を提案し,モデル改善に役立たない余分なノイズのある問合せを選択的にフィルタリングする。
提案した DETR の改良により,従来の回転型 DETR モデルや他の代替モデルよりも優れた性能が得られた。
これは、DOTA-v1.0/v1.5/v2.0やDIOR-Rといったベンチマークにおける我々のモデルの現状によって証明されている。
関連論文リスト
- Relation DETR: Exploring Explicit Position Relation Prior for Object Detection [26.03892270020559]
本稿では,DETR(Detection TRansformer)の収束性と性能を向上させる手法を提案する。
我々の手法であるRelation-DETRは、プログレッシブ・アテンション・リファインメントのための位置関係埋め込みを構築するエンコーダを導入している。
汎用データセットとタスク固有のデータセットの両方の実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-16T13:17:07Z) - TD^2-Net: Toward Denoising and Debiasing for Dynamic Scene Graph
Generation [76.24766055944554]
動的SGGのデノベーションとデボアシングを目的としたネットワークTD$2$-Netを導入する。
TD$2$-Netは、述語分類における平均リコール@10で、第2位の競争相手を12.7%上回っている。
論文 参考訳(メタデータ) (2024-01-23T04:17:42Z) - Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Analyzing and Mitigating Interference in Neural Architecture Search [96.60805562853153]
本研究では、異なる子モデルをサンプリングし、共有演算子の勾配類似度を計算することで干渉問題を解明する。
これら2つの観測から着想を得て、干渉を緩和するための2つのアプローチを提案する。
検索したアーキテクチャは、RoBERTa$_rmbase$が1.1、0.6、ELECTRA$_rmbase$が1.6、テストセットであるGLUEベンチマークで1.1より優れています。
論文 参考訳(メタデータ) (2021-08-29T11:07:46Z) - Which to Match? Selecting Consistent GT-Proposal Assignment for
Pedestrian Detection [23.92066492219922]
IoU(Universal Intersection over Union)ベースの割り当て-回帰方式は依然としてパフォーマンスを制限している。
新しい割り当てと回帰メトリックとして、1つの幾何学的敏感検索アルゴリズムを紹介します。
具体的には、MR-FPPIをR$_75$で8.8%向上させます。
論文 参考訳(メタデータ) (2021-03-18T08:54:51Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - A Systematic Evaluation of Object Detection Networks for Scientific
Plots [17.882932963813985]
PlotQAデータセット上で、様々なSOTAオブジェクト検出ネットワークの精度をトレーニングし比較する。
0.5の標準IOU設定では、ほとんどのネットワークはプロット内の比較的単純な物体を検出する場合、mAPスコアが80%以上である。
しかし、パフォーマンスは0.9のより厳格なIOUで評価されると大幅に低下し、最高のモデルでmAPは35.70%となった。
論文 参考訳(メタデータ) (2020-07-05T05:30:53Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。