論文の概要: Inter-Class Relational Loss for Small Object Detection: A Case Study on License Plates
- arxiv url: http://arxiv.org/abs/2508.14343v1
- Date: Wed, 20 Aug 2025 01:37:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.30354
- Title: Inter-Class Relational Loss for Small Object Detection: A Case Study on License Plates
- Title(参考訳): 小型物体検出のためのクラス間関係損失:ライセンスプレートを事例として
- Authors: Dian Ning, Dong Seog Han,
- Abstract要約: 一段階の多対象検出タスクでは、様々な結合(IoU)ベースのソリューションは、訓練中に目標付近で滑らかで安定した収束を目標とする。
小物体の勾配を効率的に更新するクラス間関係損失を提案する。
提案するICR損失ペナルティは,既存のIoUベースの損失に容易に付加でき,性能が向上する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In one-stage multi-object detection tasks, various intersection over union (IoU)-based solutions aim at smooth and stable convergence near the targets during training. However, IoU-based losses fail to correctly update the gradient of small objects due to an extremely flat gradient. During the update of multiple objects, the learning of small objects' gradients suffers more because of insufficient gradient updates. Therefore, we propose an inter-class relational loss to efficiently update the gradient of small objects while not sacrificing the learning efficiency of other objects based on the simple fact that an object has a spatial relationship to another object (e.g., a car plate is attached to a car in a similar position). When the predicted car plate's bounding box is not within its car, a loss punishment is added to guide the learning, which is inversely proportional to the overlapped area of the car's and predicted car plate's bounding box. By leveraging the spatial relationship at the inter-class level, the loss guides small object predictions using larger objects and enhances latent information in deeper feature maps. In this paper, we present twofold contributions using license plate detection as a case study: (1) a new small vehicle multi-license plate dataset (SVMLP), featuring diverse real-world scenarios with high-quality annotations; and (2) a novel inter-class relational loss function designed to promote effective detection performance. We highlight the proposed ICR loss penalty can be easily added to existing IoU-based losses and enhance the performance. These contributions improve the standard mean Average Precision (mAP) metric, achieving gains of 10.3% and 1.6% in mAP$^{\text{test}}_{50}$ for YOLOv12-T and UAV-DETR, respectively, without any additional hyperparameter tuning. Code and dataset will be available soon.
- Abstract(参考訳): 一段階の多対象検出タスクでは、様々な結合(IoU)ベースのソリューションは、訓練中に目標付近で滑らかで安定した収束を目標とする。
しかし、IoUに基づく損失は、非常に平坦な勾配のため、小さな物体の勾配を正しく更新することができない。
複数のオブジェクトの更新において、小さなオブジェクトの勾配の学習は、勾配の更新が不十分なため、より困難になる。
そこで本研究では,物体が他の物体と空間的関係にあるという単純な事実に基づいて,他の物体の学習効率を犠牲にすることなく,小型物体の勾配を効率的に更新するクラス間関係損失を提案する。
予測された車板のバウンディングボックスが車内にない場合、学習を誘導するために損失罰が追加され、これは車板と予測された車板のバウンディングボックスの重なり合う領域に逆比例する。
クラス間レベルでの空間的関係を活用することにより、損失はより大きなオブジェクトを用いて小さなオブジェクト予測を導出し、より深い特徴マップにおける潜伏情報を強化する。
本稿では,(1)高品位アノテーションを用いた多種多様な現実シナリオを特徴とする小型車両用マルチライセンスプレートデータセット(SVMLP),(2)効果的な検出性能向上を目的としたクラス間リレーショナル損失関数を提案する。
提案するICR損失ペナルティは,既存のIoUベースの損失に容易に付加でき,性能が向上する。
これらの貢献により、平均精度(mAP)メートル法が改善され、追加のハイパーパラメータチューニングなしで、それぞれYOLOv12-TおよびUAV-DETRに対して、mAP$^{\text{test}}_{50}$で10.3%と1.6%のゲインを得た。
コードとデータセットは近く提供される。
関連論文リスト
- Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - OpenNet: Incremental Learning for Autonomous Driving Object Detection
with Balanced Loss [3.761247766448379]
提案手法は既存手法よりも優れた性能が得られる。
CODAデータセットを用いた実験結果から,提案手法は既存手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-11-25T06:02:50Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Optimized Loss Functions for Object detection: A Case Study on Nighttime
Vehicle Detection [0.0]
本稿では,2つの損失関数を同時に分類と局所化に最適化する。
本研究は, 正試料の局在化精度向上のためにのみ相関が適用されている既存研究と比較して, 相関を利用して真に硬い負試料を得る。
MIoUと呼ばれる新しい局所化損失は、予測ボックスとターゲットボックスの間のマハラノビス距離を組み込むことで、DIoU損失の勾配の不整合を解消する。
論文 参考訳(メタデータ) (2020-11-11T03:00:49Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Resolving Class Imbalance in Object Detection with Weighted Cross
Entropy Losses [0.0]
物体検出はコンピュータビジョンにおいて重要なタスクであり、自律運転、監視、ロボット工学といった現実世界の多くのアプリケーションに役立っている。
不均一なオブジェクトクラス分布を持つ特別なデータセットに関しては、検出器のパフォーマンスにはまだ制限がある。
クロスエントロピー損失の重み付き変種を適用して,そのような問題を探索し,克服することを提案する。
論文 参考訳(メタデータ) (2020-06-02T06:36:12Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。