論文の概要: Gaussian Combined Distance: A Generic Metric for Object Detection
- arxiv url: http://arxiv.org/abs/2510.27649v1
- Date: Fri, 31 Oct 2025 17:24:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.180889
- Title: Gaussian Combined Distance: A Generic Metric for Object Detection
- Title(参考訳): Gaussian Combined Distance: オブジェクト検出のためのジェネリックメトリック
- Authors: Ziqian Guan, Xieyi Fu, Pengjun Huang, Hengyuan Zhang, Hubin Du, Yongtao Liu, Yinglin Wang, Qang Ma,
- Abstract要約: オブジェクト検出では、よく定義された類似度メトリックがモデルの性能を大幅に向上させることができる。
現在、IoUに基づく類似度測定は検出器にとって最も好まれる選択である。
GCD(Gaussian Combined Distance)について紹介する。
- 参考スコア(独自算出の注目度): 7.3925674682779645
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In object detection, a well-defined similarity metric can significantly enhance model performance. Currently, the IoU-based similarity metric is the most commonly preferred choice for detectors. However, detectors using IoU as a similarity metric often perform poorly when detecting small objects because of their sensitivity to minor positional deviations. To address this issue, recent studies have proposed the Wasserstein Distance as an alternative to IoU for measuring the similarity of Gaussian-distributed bounding boxes. However, we have observed that the Wasserstein Distance lacks scale invariance, which negatively impacts the model's generalization capability. Additionally, when used as a loss function, its independent optimization of the center attributes leads to slow model convergence and unsatisfactory detection precision. To address these challenges, we introduce the Gaussian Combined Distance (GCD). Through analytical examination of GCD and its gradient, we demonstrate that GCD not only possesses scale invariance but also facilitates joint optimization, which enhances model localization performance. Extensive experiments on the AI-TOD-v2 dataset for tiny object detection show that GCD, as a bounding box regression loss function and label assignment metric, achieves state-of-the-art performance across various detectors. We further validated the generalizability of GCD on the MS-COCO-2017 and Visdrone-2019 datasets, where it outperforms the Wasserstein Distance across diverse scales of datasets. Code is available at https://github.com/MArKkwanGuan/mmdet-GCD.
- Abstract(参考訳): オブジェクト検出では、よく定義された類似度メトリックがモデルの性能を大幅に向上させることができる。
現在、IoUに基づく類似度測定は検出器にとって最も好まれる選択である。
しかし、IoUを類似度測定として使用する検出器は、小さな位置ずれに対する感度のため、小さな物体を検出する際には、しばしば性能が劣る。
この問題に対処するために、最近の研究は、ガウス分布境界箱の類似度を測定するためのIoUの代替としてワッサーシュタイン距離を提案した。
しかし、ワッサーシュタイン距離はスケール不変性に欠けており、これはモデルの一般化能力に悪影響を及ぼす。
さらに、損失関数として使用する場合、中心属性の独立な最適化は、モデル収束の遅さと不満足な検出精度をもたらす。
これらの課題に対処するため,ガウス複合距離(GCD)を導入する。
GCDとその勾配の解析的検討により、GCDはスケール不変性を持つだけでなく、モデル局所化性能を向上させる共同最適化も促進することを示した。
微小物体検出のためのAI-TOD-v2データセットの大規模な実験により、GCDは、境界ボックス回帰損失関数とラベル割り当てメトリックとして、様々な検出器間で最先端のパフォーマンスを達成することが示された。
我々はさらに、MS-COCO-2017とVisdrone-2019データセットにおけるGCDの一般化可能性を検証する。
コードはhttps://github.com/MArKkwanGuan/mmdet-GCDで入手できる。
関連論文リスト
- DAC: Detector-Agnostic Spatial Covariances for Deep Local Features [11.494662473750505]
現在の深部視覚特徴検出器は検出された特徴の空間的不確かさをモデル化していない。
本稿では,事前訓練したディープ特徴検出器に接続可能な2つのポストホック共分散推定法を提案する。
論文 参考訳(メタデータ) (2023-05-20T17:43:09Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Projected Sliced Wasserstein Autoencoder-based Hyperspectral Images
Anomaly Detection [42.585075865267946]
本稿では,PSW自動エンコーダを用いた異常検出手法を提案する。
特に、計算フレンドリーな固有分解法を利用して、高次元データをスライスする主成分を見つける。
様々な実世界のハイパースペクトル異常検出ベンチマークで実施した総合的な実験は,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2021-12-20T09:21:02Z) - A Normalized Gaussian Wasserstein Distance for Tiny Object Detection [21.50800336432307]
最先端の検出器は、外観情報がないため、小さな物体に対して満足な結果を出さない。
微小物体検出のためのワッサーシュタイン距離を用いた新しい評価指標を提案する。
論文 参考訳(メタデータ) (2021-10-26T03:43:17Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。