論文の概要: Pixel-level Quality Assessment for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2511.08186v1
- Date: Wed, 12 Nov 2025 01:45:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.684833
- Title: Pixel-level Quality Assessment for Oriented Object Detection
- Title(参考訳): オブジェクト指向物体検出のための画素レベルの品質評価
- Authors: Yunhui Zhu, Buliao Huang,
- Abstract要約: ボックスレベルのIoU予測を画素レベルの空間整合性の統合に置き換える新しいPQAフレームワークを提案する。
PQAは、予測ボックスに対する各ピクセルの相対位置と、GTボックスに対する対応する位置とのアライメントを測定する。
我々は,画素レベルの空間的一貫性を統一された品質スコアに集約する新たな積分計量を導入し,実際の局所化品質をより正確に近似する。
- 参考スコア(独自算出の注目度): 1.4323566945483497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern oriented object detectors typically predict a set of bounding boxes and select the top-ranked ones based on estimated localization quality. Achieving high detection performance requires that the estimated quality closely aligns with the actual localization accuracy. To this end, existing approaches predict the Intersection over Union (IoU) between the predicted and ground-truth (GT) boxes as a proxy for localization quality. However, box-level IoU prediction suffers from a structural coupling issue: since the predicted box is derived from the detector's internal estimation of the GT box, the predicted IoU--based on their similarity--can be overestimated for poorly localized boxes. To overcome this limitation, we propose a novel Pixel-level Quality Assessment (PQA) framework, which replaces box-level IoU prediction with the integration of pixel-level spatial consistency. PQA measures the alignment between each pixel's relative position to the predicted box and its corresponding position to the GT box. By operating at the pixel level, PQA avoids directly comparing the predicted box with the estimated GT box, thereby eliminating the inherent similarity bias in box-level IoU prediction. Furthermore, we introduce a new integration metric that aggregates pixel-level spatial consistency into a unified quality score, yielding a more accurate approximation of the actual localization quality. Extensive experiments on HRSC2016 and DOTA demonstrate that PQA can be seamlessly integrated into various oriented object detectors, consistently improving performance (e.g., +5.96% AP$_{50:95}$ on Rotated RetinaNet and +2.32% on STD).
- Abstract(参考訳): 現代のオブジェクト指向物体検出器は、通常、境界ボックスのセットを予測し、推定された局所化品質に基づいてトップランクのものを選択します。
高い検出性能を達成するためには、推定品質が実際の位置決め精度と密接に一致することが必要である。
この目的のために、既存のアプローチは、ローカライズ品質のプロキシとして、予測されたGTボックスとグランドトゥルース(GT)ボックスの間のIoU(Intersection over Union)を予測する。
しかし、ボックスレベルのIoU予測は構造的結合の問題に悩まされる:予測されたボックスは検出器の内部でGTボックスを推定することに由来するため、予測されたIoUは類似性に基づいて、ローカライズされていないボックスに対して過大評価される。
この制限を克服するために,画素レベルの空間整合性の統合によりボックスレベルのIoU予測を置き換える,新しいPQAフレームワークを提案する。
PQAは、予測ボックスに対する各ピクセルの相対位置と、GTボックスに対する対応する位置とのアライメントを測定する。
ピクセルレベルでの操作により、PQAは予測ボックスと推定GTボックスを直接比較することを避け、ボックスレベルのIoU予測に固有の類似性バイアスを取り除く。
さらに、画素レベルの空間的一貫性を統一された品質スコアに集約し、実際のローカライゼーション品質をより正確に近似する新しい積分計量を導入する。
HRSC2016とDOTAの大規模な実験は、PQAが様々な指向性物体検出器にシームレスに統合され、連続的に性能が向上することを示した(例えば、+5.96% AP$_{50:95}$ on Rotated RetinaNetと+2.32% on STD)。
関連論文リスト
- Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - Cascade-DETR: Delving into High-Quality Universal Object Detection [99.62131881419143]
高品質な普遍物体検出のためのカスケードDETRを提案する。
本稿では,オブジェクト中心情報を検出デコーダに明示的に統合するカスケードアテンション層を提案する。
最後に、多様なドメインから10のデータセットを含む汎用オブジェクト検出ベンチマークUDB10を紹介する。
論文 参考訳(メタデータ) (2023-07-20T17:11:20Z) - DAFNe: A One-Stage Anchor-Free Deep Model for Oriented Object Detection [16.21161769128316]
DAFNe: オブジェクト指向物体検出のためのワンステージアンカーフリーディープネットワークを提案する。
アンカーフリーモデルとして、DAFNeはバウンディングボックスアンカーの使用を控えることで予測複雑性を低減する。
低品質な予測に対する任意指向の有界箱に対する中心性関数の指向性を考慮した一般化を提案する。
論文 参考訳(メタデータ) (2021-09-13T17:37:20Z) - Generalized Focal Loss V2: Learning Reliable Localization Quality
Estimation for Dense Object Detection [78.11775981796367]
GFLV2 (ResNet-101) は14.6 FPSで46.2 APを達成し、以前の最先端ATSSベースライン (43.6 AP at 14.6 FPS) をCOCO tt test-devで絶対2.6 APで上回った。
コードはhttps://github.com/implus/GFocalV2.comから入手できる。
論文 参考訳(メタデータ) (2020-11-25T17:06:37Z) - Location-Aware Box Reasoning for Anchor-Based Single-Shot Object
Detection [19.669531374307805]
単発物体検出器は、ボックス提案の事前選択がないため、ボックスの品質を損なう。
境界ボックスに対する位置認識型アンカーベース推論(LAAR)を提案する。
LAARは、バウンディングボックスの品質評価を考慮して、位置と分類の信頼性の両方を考慮に入れている。
論文 参考訳(メタデータ) (2020-07-13T08:24:41Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。