論文の概要: Improvement of Classification in One-Stage Detector
- arxiv url: http://arxiv.org/abs/2011.10465v1
- Date: Fri, 20 Nov 2020 15:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:21:18.166127
- Title: Improvement of Classification in One-Stage Detector
- Title(参考訳): 一段階検出器の分類改善
- Authors: Wu Kehe, Chen Zuge, Zhang Xiaoliang, Li Wei
- Abstract要約: RetinaNetは分類タスクのためのFocal Lossを提案し、1段検出器を大幅に改善した。
我々はRetinaNetの予測を解析し、分類と局所化のミスアライメントが主な要因であることを示す。
本稿では,この問題に対するオブジェクト信頼タスクを提案し,その特徴を分類タスクと共有する。
- 参考スコア(独自算出の注目度): 3.1083395673891108
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: RetinaNet proposed Focal Loss for classification task and improved one-stage
detectors greatly. However, there is still a gap between it and two-stage
detectors. We analyze the prediction of RetinaNet and find that the
misalignment of classification and localization is the main factor. Most of
predicted boxes, whose IoU with ground-truth boxes are greater than 0.5, while
their classification scores are lower than 0.5, which shows that the
classification task still needs to be optimized. In this paper we proposed an
object confidence task for this problem, and it shares features with
classification task. This task uses IoUs between samples and ground-truth boxes
as targets, and it only uses losses of positive samples in training, which can
increase loss weight of positive samples in classification task training. Also
the joint of classification score and object confidence will be used to guide
NMS. Our method can not only improve classification task, but also ease
misalignment of classification and localization. To evaluate the effectiveness
of this method, we show our experiments on MS COCO 2017 dataset. Without
whistles and bells, our method can improve AP by 0.7% and 1.0% on COCO
validation dataset with ResNet50 and ResNet101 respectively at same training
configs, and it can achieve 38.4% AP with two times training time. Code is at:
http://github.com/chenzuge1/RetinaNet-Conf.git.
- Abstract(参考訳): RetinaNetは分類タスクのためのFocal Lossを提案し、1段検出器を大幅に改善した。
しかし、それと2段検出器の間にはまだギャップがある。
我々はRetinaNetの予測を解析し、分類と局所化のミスアライメントが主な要因であることを示す。
予測されたボックスのほとんどは、iouと接地ボックスが0.5以上あるが、分類スコアは0.5未満であり、分類タスクを最適化する必要があることを示している。
本稿では,この問題に対するオブジェクト信頼度タスクを提案し,その特徴を分類タスクと共有する。
このタスクは、サンプルと接地ボックスの間のiousをターゲットとして使用し、トレーニングで陽性サンプルの損失のみを使用し、分類タスクトレーニングで陽性サンプルの損失重量を増加させる。
また、分類スコアとオブジェクト信頼の結合がNMSのガイドに使用される。
本手法は分類作業を改善するだけでなく,分類と局所化の誤認を緩和する。
本手法の有効性を評価するため,MS COCO 2017データセットを用いて実験を行った。
ホイッスルとベルを使わずに、同じトレーニング設定でResNet50とResNet101でそれぞれCOCO検証データセットのAPを0.7%、1.0%改善することが可能で、2回のトレーニング時間で38.4%APを達成することができる。
コードは http://github.com/chenzuge1/RetinaNet-Conf.git.com にある。
関連論文リスト
- FDCNet: Feature Drift Compensation Network for Class-Incremental Weakly
Supervised Object Localization [10.08410402383604]
本研究は、クラス増分弱教師付きオブジェクトローカライゼーション(CI-WSOL)の課題に対処する。
ゴールは、画像レベルのアノテーションのみを使用して、新しいクラスのオブジェクトローカライゼーションを漸進的に学習し、以前に学習したクラスをローカライズする能力を維持することである。
まず、クラスインクリメンタル分類器の戦略を破滅的な忘れ方に適用し、CI-WSOLの強力なベースライン法を提案する。
そこで我々は,特徴ドリフトがクラススコアやローカライゼーションマップに与える影響を補償する特徴ドリフト補償ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-17T01:10:45Z) - Improving Localization for Semi-Supervised Object Detection [3.5493798890908104]
予測された有界ボックスのフィルタリングを改善するために,有界ボックスのローカライゼーションのための追加の分類タスクを導入する。
我々のIL-netは制限付きアノテーション方式でデータセット上でSSOD性能を1.14%向上させることを示した。
論文 参考訳(メタデータ) (2022-06-21T08:39:38Z) - Ranking-Based Siamese Visual Tracking [31.2428211299895]
シームズベースのトラッカーは、主に視覚追跡を2つの独立したサブタスクに定式化し、分類とローカライゼーションを含む。
本稿では,異なる提案間の関係を探索するランキングベース最適化アルゴリズムを提案する。
提案された2つのランキングの損失は、ほとんどのシームズトラッカーと互換性があり、推論のための追加計算は発生しない。
論文 参考訳(メタデータ) (2022-05-24T03:46:40Z) - End-to-End Semi-Supervised Object Detection with Soft Teacher [63.26266730447914]
本稿では,従来の複雑な多段階法とは対照的に,終端から終端までの半教師付き物体検出手法を提案する。
提案手法は, 種々のラベル付け比において, 従来手法よりも大きなマージンで性能を向上する。
最先端のSwin Transformerベースの物体検出器では、検出精度を+1.5 mAPで大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-06-16T17:59:30Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - OVANet: One-vs-All Network for Universal Domain Adaptation [78.86047802107025]
既存のメソッドは、検証または未知のサンプルの事前定義された比率に基づいて未知のサンプルを拒否するしきい値を手動で設定します。
本稿では,ソースサンプルを用いて閾値を学習し,対象領域に適応する手法を提案する。
私たちの考えは、ソースドメインの最小クラス間距離は、ターゲットの既知のか未知かを決定するための良いしきい値であるべきです。
論文 参考訳(メタデータ) (2021-04-07T18:36:31Z) - Optimized Loss Functions for Object detection: A Case Study on Nighttime
Vehicle Detection [0.0]
本稿では,2つの損失関数を同時に分類と局所化に最適化する。
本研究は, 正試料の局在化精度向上のためにのみ相関が適用されている既存研究と比較して, 相関を利用して真に硬い負試料を得る。
MIoUと呼ばれる新しい局所化損失は、予測ボックスとターゲットボックスの間のマハラノビス距離を組み込むことで、DIoU損失の勾配の不整合を解消する。
論文 参考訳(メタデータ) (2020-11-11T03:00:49Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z) - Dynamic R-CNN: Towards High Quality Object Detection via Dynamic
Training [70.2914594796002]
ラベル割り当て基準と回帰損失関数の形状を調整するための動的R-CNNを提案する。
我々はResNet-50-FPNベースラインを1.9%のAPと5.5%のAP$_90$で改善し、余分なオーバーヘッドを伴わない。
論文 参考訳(メタデータ) (2020-04-13T15:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。