論文の概要: Reconcile Prediction Consistency for Balanced Object Detection
- arxiv url: http://arxiv.org/abs/2108.10809v1
- Date: Tue, 24 Aug 2021 15:52:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 14:16:17.624390
- Title: Reconcile Prediction Consistency for Balanced Object Detection
- Title(参考訳): 平衡物体検出のための残差予測整合性
- Authors: Keyang Wang, Lei Zhang
- Abstract要約: 分類枝と局所化枝の最適化を調和させるハーモニック損失を提案する。
ハーモニック・ロスにより、これらの2つのブランチはトレーニング中にお互いを監督し、促進することができる。
トレーニング段階において, ローカライゼーション損失が外れ値に支配されるのを防止するため, 異なるIoUレベルの試料の局所化損失の重みを調和させるために, ハーモニックIoU損失を提案する。
- 参考スコア(独自算出の注目度): 10.61438063305309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification and regression are two pillars of object detectors. In most
CNN-based detectors, these two pillars are optimized independently. Without
direct interactions between them, the classification loss and the regression
loss can not be optimized synchronously toward the optimal direction in the
training phase. This clearly leads to lots of inconsistent predictions with
high classification score but low localization accuracy or low classification
score but high localization accuracy in the inference phase, especially for the
objects of irregular shape and occlusion, which severely hurts the detection
performance of existing detectors after NMS. To reconcile prediction
consistency for balanced object detection, we propose a Harmonic loss to
harmonize the optimization of classification branch and localization branch.
The Harmonic loss enables these two branches to supervise and promote each
other during training, thereby producing consistent predictions with high
co-occurrence of top classification and localization in the inference phase.
Furthermore, in order to prevent the localization loss from being dominated by
outliers during training phase, a Harmonic IoU loss is proposed to harmonize
the weight of the localization loss of different IoU-level samples.
Comprehensive experiments on benchmarks PASCAL VOC and MS COCO demonstrate the
generality and effectiveness of our model for facilitating existing object
detectors to state-of-the-art accuracy.
- Abstract(参考訳): 分類と回帰は物体検出器の2つの柱である。
ほとんどのCNNベースの検出器では、これらの2つの柱は独立に最適化されている。
それらの間の直接的な相互作用がなければ、分類損失と回帰損失は、トレーニングフェーズの最適方向に対して同期的に最適化できない。
これにより、特に不規則な形状や咬合対象において、高い分類スコア、低い局在精度、低い分類スコア、高い局在精度を有する不整合予測が多数生じ、nms後の既存の検出器の検出性能を著しく損なうことが明らかとなる。
平衡物体検出のための予測整合性を改善するために,分類枝と局所化枝の最適化を調和させる高調波損失を提案する。
調和損失により、これらの2つの分枝は、訓練中に相互に監督し、促進し、推論フェーズにおいてトップ分類とローカライゼーションの共起度の高い一貫した予測を生成することができる。
さらに, トレーニング段階において, ローカライゼーション損失が外れ値に支配されるのを防止するため, 異なるIoUレベルの試料の局所化損失の重みを調和させるために, ハーモニックIoU損失を提案する。
PASCAL VOCとMS COCOのベンチマークに関する総合的な実験により,既存の物体検出装置の最先端精度向上に向けたモデルの有効性と有効性を示した。
関連論文リスト
- Energy Score-based Pseudo-Label Filtering and Adaptive Loss for Imbalanced Semi-supervised SAR target recognition [1.2035771704626825]
既存の半教師付きSAR ATRアルゴリズムは、クラス不均衡の場合、認識精度が低い。
この研究は、動的エネルギースコアと適応損失を用いた非平衡半教師付きSAR目標認識手法を提供する。
論文 参考訳(メタデータ) (2024-11-06T14:45:16Z) - Towards Robust and Interpretable EMG-based Hand Gesture Recognition using Deep Metric Meta Learning [37.21211404608413]
本稿では,意味的かつ解釈可能な表現の作成を監督するために,EMG PRにおける深層メートル法メタラーニングへのシフトを提案する。
我々は、不正確な決定をよりよく拒否する頑健なクラス近接性に基づく信頼度推定器を導出する。
論文 参考訳(メタデータ) (2024-04-17T23:37:50Z) - Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - Correlation Loss: Enforcing Correlation between Classification and
Localization [18.195355848127285]
相関損失は、相関係数を直接最適化することにより、様々な物体検出器の性能を向上させる新しいプラグイン損失関数である。
Sparse R-CNNの最良のモデルは、COCOテストデブの試験時間増強なしで51.0 APに達し、最先端に到達します。
論文 参考訳(メタデータ) (2023-01-03T09:36:48Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - Optimized Loss Functions for Object detection: A Case Study on Nighttime
Vehicle Detection [0.0]
本稿では,2つの損失関数を同時に分類と局所化に最適化する。
本研究は, 正試料の局在化精度向上のためにのみ相関が適用されている既存研究と比較して, 相関を利用して真に硬い負試料を得る。
MIoUと呼ばれる新しい局所化損失は、予測ボックスとターゲットボックスの間のマハラノビス距離を組み込むことで、DIoU損失の勾配の不整合を解消する。
論文 参考訳(メタデータ) (2020-11-11T03:00:49Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。