論文の概要: Confidence-driven Bounding Box Localization for Small Object Detection
- arxiv url: http://arxiv.org/abs/2303.01803v1
- Date: Fri, 3 Mar 2023 09:19:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 15:32:38.135381
- Title: Confidence-driven Bounding Box Localization for Small Object Detection
- Title(参考訳): 小物体検出のための信頼駆動バウンディングボックス位置決め
- Authors: Huixin Sun, Baochang Zhang, Yanjing Li, Xianbin Cao
- Abstract要約: 信頼性駆動型バウンディングボックスローカライゼーション(C-BBL)法を提案する。
C-BBLは連続ラベルをグリッドに量子化し、2ホット基底の真理ラベルを定式化する。
異なるラベルシステムに対するC-BBLの一般化可能性と高分解能検出の有効性を示す。
- 参考スコア(独自算出の注目度): 30.906712428887147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite advancements in generic object detection, there remains a performance
gap in detecting small objects compared to normal-scale objects. We for the
first time observe that existing bounding box regression methods tend to
produce distorted gradients for small objects and result in less accurate
localization. To address this issue, we present a novel Confidence-driven
Bounding Box Localization (C-BBL) method to rectify the gradients. C-BBL
quantizes continuous labels into grids and formulates two-hot ground truth
labels. In prediction, the bounding box head generates a confidence
distribution over the grids. Unlike the bounding box regression paradigms in
conventional detectors, we introduce a classification-based localization
objective through cross entropy between ground truth and predicted confidence
distribution, generating confidence-driven gradients. Additionally, C-BBL
describes a uncertainty loss based on distribution entropy in labels and
predictions to further reduce the uncertainty in small object localization. The
method is evaluated on multiple detectors using three object detection
benchmarks and consistently improves baseline detectors, achieving
state-of-the-art performance. We also demonstrate the generalizability of C-BBL
to different label systems and effectiveness for high resolution detection,
which validates its prospect as a general solution.
- Abstract(参考訳): 汎用オブジェクト検出の進歩にもかかわらず、通常のスケールオブジェクトと比較して小さなオブジェクトを検出する場合のパフォーマンスギャップは残っている。
我々は,既存のバウンディングボックス回帰法が小さな物体に対して歪んだ勾配を生じさせる傾向にあり,正確な位置推定ができないことを初めて観察した。
この問題に対処するために,信頼性駆動型バウンディングボックスローカライゼーション(C-BBL)法を提案する。
C-BBLは連続ラベルをグリッドに量子化し、2ホット基底の真理ラベルを定式化する。
予測において、バウンディングボックスヘッドはグリッド上の信頼分布を生成する。
従来の検出器における境界ボックス回帰パラダイムとは異なり、基底真理と予測信頼分布の相互エントロピーによる分類に基づく局所化目標を導入し、信頼性駆動勾配を生成する。
さらに、C-BBLは、ラベルの分布エントロピーに基づく不確実性損失を記述し、小さなオブジェクトのローカライゼーションにおける不確実性をさらに低減するために予測する。
この手法は3つの物体検出ベンチマークを用いて複数の検出器で評価され、ベースライン検出器を一貫して改善し、最先端の性能を達成する。
また,C-BBLの異なるラベルシステムへの一般化可能性や高分解能検出の有効性を実証し,一般解としての可能性を検証する。
関連論文リスト
- Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection [22.297964850282177]
教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、モデルトレーニングを初期化するためにクラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用するのが一般的である。
UA3Dと呼ばれる教師なし3Dオブジェクト検出のための新しい不確実性認識フレームワークを導入する。
論文 参考訳(メタデータ) (2024-08-01T15:01:07Z) - Bi-discriminator Domain Adversarial Neural Networks with Class-Level
Gradient Alignment [87.8301166955305]
そこで本研究では,クラスレベルのアライメントアライメントを有するバイディミネータドメイン対向ニューラルネットワークを提案する。
BACGは、領域分布の整合性を改善するために勾配信号と二階確率推定を利用する。
さらに、対照的な学習にインスパイアされ、トレーニングプロセスを大幅に短縮できるメモリバンクベースの変種であるFast-BACGを開発した。
論文 参考訳(メタデータ) (2023-10-21T09:53:17Z) - Exploiting Low-confidence Pseudo-labels for Source-free Object Detection [54.98300313452037]
Source-free Object Detection (SFOD) は、ラベル付きソースデータにアクセスすることなく、未ラベルのターゲットドメインにソーストレーニングされた検出器を適応することを目的としている。
現在のSFOD法は適応相におけるしきい値に基づく擬似ラベル手法を用いる。
疑似ラベルを最大限に活用するために,高信頼度と低信頼度しきい値を導入する手法を提案する。
論文 参考訳(メタデータ) (2023-10-19T12:59:55Z) - Localization-Guided Track: A Deep Association Multi-Object Tracking
Framework Based on Localization Confidence of Detections [4.565826090373598]
局所化信頼度はMOTで初めて適用され、検出ボックスの外観明快さと位置化精度が考慮される。
提案手法は, 比較した最先端追跡法より優れる。
論文 参考訳(メタデータ) (2023-09-18T13:45:35Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - Boundary Distribution Estimation for Precise Object Detection [12.247010914825971]
オブジェクト検出の分野では、オブジェクトのローカライゼーションのタスクは、バウンディングボックスのレグレッションに重点を置いて達成されるのが一般的である。
これは伝統的に、ボックスの中央の位置とスケーリング要素を後退させることで、オブジェクトの位置を予測する。
本稿では,従来の手法の欠点を理論的解析と実験的検証によって解決する。
本手法は,物体の境界における推定分布に基づいてボックスエッジを精製することにより,境界ボックスの局所化の精度を高める。
論文 参考訳(メタデータ) (2021-11-02T06:58:22Z) - Uncertainty-Aware Model Adaptation for Unsupervised Cross-Domain Object
Detection [12.807987076435928]
この研究は、教師なしのクロスドメインオブジェクト検出問題に取り組む。
これは、事前訓練された物体検出器をラベルなしで新しいターゲットドメインに一般化することを目的としている。
論文 参考訳(メタデータ) (2021-08-28T09:37:18Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。