論文の概要: Wise-IoU: Bounding Box Regression Loss with Dynamic Focusing Mechanism
- arxiv url: http://arxiv.org/abs/2301.10051v3
- Date: Sat, 8 Apr 2023 13:58:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 20:53:30.944767
- Title: Wise-IoU: Bounding Box Regression Loss with Dynamic Focusing Mechanism
- Title(参考訳): wise-iou:動的フォーカス機構によるバウンディングボックス回帰損失
- Authors: Zanjia Tong, Yuhang Chen, Zewei Xu, Rong Yu
- Abstract要約: Wese-IoU(WIoU)と呼ばれる動的非単調FMを用いたIoUベースの損失を提案する。
この戦略は、高品質なアンカーボックスの競争性を低減し、低品質な例によって生じる有害な勾配を低減させる。
WIoUを最先端のリアルタイム検出器YOLOv7に適用すると、MS-COCOデータセット上のAP-75は53.03%から54.50%に改善される。
- 参考スコア(独自算出の注目度): 7.645166402471877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The loss function for bounding box regression (BBR) is essential to object
detection. Its good definition will bring significant performance improvement
to the model. Most existing works assume that the examples in the training data
are high-quality and focus on strengthening the fitting ability of BBR loss. If
we blindly strengthen BBR on low-quality examples, it will jeopardize
localization performance. Focal-EIoU v1 was proposed to solve this problem, but
due to its static focusing mechanism (FM), the potential of non-monotonic FM
was not fully exploited. Based on this idea, we propose an IoU-based loss with
a dynamic non-monotonic FM named Wise-IoU (WIoU). The dynamic non-monotonic FM
uses the outlier degree instead of IoU to evaluate the quality of anchor boxes
and provides a wise gradient gain allocation strategy. This strategy reduces
the competitiveness of high-quality anchor boxes while also reducing the
harmful gradient generated by low-quality examples. This allows WIoU to focus
on ordinary-quality anchor boxes and improve the detector's overall
performance. When WIoU is applied to the state-of-the-art real-time detector
YOLOv7, the AP-75 on the MS-COCO dataset is improved from 53.03% to 54.50%.
Code is available at https://github.com/Instinct323/wiou.
- Abstract(参考訳): オブジェクト検出にはバウンディングボックス回帰(BBR)の損失関数が不可欠である。
その良い定義はモデルに大幅なパフォーマンス改善をもたらすだろう。
既存の研究の多くは、トレーニングデータの例が高品質であり、bbr損失の適合能力の強化に重点を置いていると仮定している。
低品質の例でbbrを盲目的に強化すれば、ローカライズのパフォーマンスを損なうことになります。
Focal-EIoU v1はこの問題を解決するために提案されたが、静的集束機構(FM)のため、非単調FMの可能性は完全には利用されなかった。
このアイデアに基づいて,Wise-IoU(WIoU)と呼ばれる動的非単調FMを用いたIoUに基づく損失を提案する。
動的非単調FMは、IoUの代わりに外れ度を用いてアンカーボックスの品質を評価し、賢明な勾配ゲイン割り当て戦略を提供する。
この戦略は高品質アンカーボックスの競争力を低下させ、また低品質の例によって生じる有害な勾配を減少させる。
これにより、WIoUは通常の高品質のアンカーボックスに集中し、検出器全体の性能を改善することができる。
WIoUを最先端のリアルタイム検出器YOLOv7に適用すると、MS-COCOデータセット上のAP-75は53.03%から54.50%に改善される。
コードはhttps://github.com/instinct323/wiouで入手できる。
関連論文リスト
- Unified-IoU: For High-Quality Object Detection [1.62877896907106]
そこで我々は,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
提案手法は,複数のデータセット,特にIoU閾値が高い場合において,より優れた性能を実現する。
論文 参考訳(メタデータ) (2024-08-13T04:56:45Z) - Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models [29.863953001061635]
拡散モデル(DM)は高品質で多様な画像を生成する上で優れた性能を示した。
既存の作業は主にDM効率を高めるためのトレーニングプロセスを採用している。
本稿では,アテンション駆動型トレーニングフリー効率拡散モデル (AT-EDM) フレームワークについて紹介する。
論文 参考訳(メタデータ) (2024-05-08T17:56:47Z) - Towards Robust Federated Learning via Logits Calibration on Non-IID Data [49.286558007937856]
Federated Learning(FL)は、エッジネットワークにおける分散デバイスの共同モデルトレーニングに基づく、プライバシ保護のための分散管理フレームワークである。
近年の研究では、FLは敵の例に弱いことが示されており、その性能は著しく低下している。
本研究では,対戦型訓練(AT)フレームワークを用いて,対戦型実例(AE)攻撃に対するFLモデルの堅牢性を向上させる。
論文 参考訳(メタデータ) (2024-03-05T09:18:29Z) - Inner-IoU: More Effective Intersection over Union Loss with Auxiliary
Bounding Box [10.03001043843768]
補助的バウンディングボックスを通してIoU損失を算出する内IoU損失を提案する。
異なるデータセットや検出器に対して、補助境界ボックスのスケールサイズを制御するためのスケーリング係数比を導入する。
最後に、シミュレーションと比較実験のために既存のIoUベースの損失関数にInner-IoUを統合する。
論文 参考訳(メタデータ) (2023-11-06T05:14:24Z) - FedNAR: Federated Optimization with Normalized Annealing Regularization [54.42032094044368]
ウェイト崩壊の選択を探索し、ウェイト崩壊値が既存のFLアルゴリズムの収束に有意な影響を及ぼすことを確かめる。
我々は,既存のFLアルゴリズムにシームレスに統合可能なプラグインであるFederated Optimization with Normalized Annealing Regularization (FedNAR)を開発した。
論文 参考訳(メタデータ) (2023-10-04T21:11:40Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - A Systematic IoU-Related Method: Beyond Simplified Regression for Better
Localization [9.036025934093965]
本稿では,2つのボックスが重なり合っていない場合によく定義され,重なり合っているときに標準IoUに還元される拡張IoUを提案する。
第3に、最小限のEIoU損失をより安定かつスムーズに接近させる安定最適化手法(SOT)を提案する。
論文 参考訳(メタデータ) (2021-12-03T09:00:55Z) - Alpha-IoU: A Family of Power Intersection over Union Losses for Bounding
Box Regression [59.72580239998315]
我々は、既存のIoUベースの損失を、パワーIoU項と追加のパワー正規化項を有する新しいパワーIoU損失ファミリーに一般化する。
複数のオブジェクト検出ベンチマークとモデルの実験では、$alpha$-IoUの損失が既存のIoUベースの損失を顕著なパフォーマンスマージンで上回ることを示した。
論文 参考訳(メタデータ) (2021-10-26T13:09:20Z) - Focal and Efficient IOU Loss for Accurate Bounding Box Regression [63.14659624634066]
オブジェクト検出では、境界ボックス回帰(BBR)はオブジェクトローカリゼーションのパフォーマンスを決定する重要なステップです。
i) $ell_n$-norm と IOU ベースのロス関数はどちらも BBR の目的を描くのに非効率的であり、これは遅い収束と不正確な回帰結果をもたらす。
論文 参考訳(メタデータ) (2021-01-20T14:33:58Z) - Dynamic R-CNN: Towards High Quality Object Detection via Dynamic
Training [70.2914594796002]
ラベル割り当て基準と回帰損失関数の形状を調整するための動的R-CNNを提案する。
我々はResNet-50-FPNベースラインを1.9%のAPと5.5%のAP$_90$で改善し、余分なオーバーヘッドを伴わない。
論文 参考訳(メタデータ) (2020-04-13T15:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。