論文の概要: A Systematic IoU-Related Method: Beyond Simplified Regression for Better
Localization
- arxiv url: http://arxiv.org/abs/2112.01793v1
- Date: Fri, 3 Dec 2021 09:00:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 22:47:10.523496
- Title: A Systematic IoU-Related Method: Beyond Simplified Regression for Better
Localization
- Title(参考訳): 系統的IoU関連手法: 局所性向上のための簡易回帰を超えて
- Authors: Hanyang Peng and Shiqi Yu
- Abstract要約: 本稿では,2つのボックスが重なり合っていない場合によく定義され,重なり合っているときに標準IoUに還元される拡張IoUを提案する。
第3に、最小限のEIoU損失をより安定かつスムーズに接近させる安定最適化手法(SOT)を提案する。
- 参考スコア(独自算出の注目度): 9.036025934093965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Four-variable-independent-regression localization losses, such as
Smooth-$\ell_1$ Loss, are used by default in modern detectors. Nevertheless,
this kind of loss is oversimplified so that it is inconsistent with the final
evaluation metric, intersection over union (IoU). Directly employing the
standard IoU is also not infeasible, since the constant-zero plateau in the
case of non-overlapping boxes and the non-zero gradient at the minimum may make
it not trainable. Accordingly, we propose a systematic method to address these
problems. Firstly, we propose a new metric, the extended IoU (EIoU), which is
well-defined when two boxes are not overlapping and reduced to the standard IoU
when overlapping. Secondly, we present the convexification technique (CT) to
construct a loss on the basis of EIoU, which can guarantee the gradient at the
minimum to be zero. Thirdly, we propose a steady optimization technique (SOT)
to make the fractional EIoU loss approaching the minimum more steadily and
smoothly. Fourthly, to fully exploit the capability of the EIoU based loss, we
introduce an interrelated IoU-predicting head to further boost localization
accuracy. With the proposed contributions, the new method incorporated into
Faster R-CNN with ResNet50+FPN as the backbone yields \textbf{4.2 mAP} gain on
VOC2007 and \textbf{2.3 mAP} gain on COCO2017 over the baseline Smooth-$\ell_1$
Loss, at almost \textbf{no training and inferencing computational cost}.
Specifically, the stricter the metric is, the more notable the gain is,
improving \textbf{8.2 mAP} on VOC2007 and \textbf{5.4 mAP} on COCO2017 at
metric $AP_{90}$.
- Abstract(参考訳): Smooth-$\ell_1$ Lossのような4変数独立回帰型ローカライゼーション損失は、現代の検出器ではデフォルトで使用される。
しかし、このような損失は、最終評価基準であるIoU(英語版)と矛盾しないように単純化されている。
標準のIoUを直接使用することも不可能であり、非オーバーラップボックスの場合の定数ゼロ台地と最小限の非ゼロ勾配はトレーニングできない可能性がある。
そこで本研究では,この問題に対処するための体系的手法を提案する。
まず,2つのボックスが重なり合っていない場合によく定義された拡張IoU(EIoU)を,重なり合っているときに標準IoUに還元する手法を提案する。
次に,EIoUに基づいて損失を構成するための凸化手法(CT)を提案する。
第3に、最小限のEIoU損失をより安定かつスムーズに接近させる安定最適化手法(SOT)を提案する。
第4に、EIoUベースの損失の能力をフル活用するために、位置推定精度をさらに向上させるために、関連したIoU予測ヘッドを導入する。
提案された貢献により、バックボーンとしてResNet50+FPNでFaster R-CNNに組み込まれた新しい手法は、VOC2007で \textbf{4.2 mAP} のゲイン、COCO2017で Smooth-$\ell_1$ Loss のベースラインであるSmooth-$\ell_1$ Loss, at almost \textbf{no training and inference compute cost} に対して \textbf{4.3 mAP} のゲインを得る。
特に、計量が厳密になるほど、この利得はより顕著になり、VOC2007 では \textbf{8.2 mAP} 、CO2017 では $AP_{90}$ で \textbf{5.4 mAP} が改善される。
関連論文リスト
- Stable Minima Cannot Overfit in Univariate ReLU Networks: Generalization by Large Step Sizes [29.466981306355066]
固定学習率$eta$の勾配降下はスムーズな関数を表す局所最小値しか見つからないことを示す。
また、$n$のデータポイントのサポートの厳密な内部で、$widetildeO(n-4/5)$のほぼ最適MSE境界を証明します。
論文 参考訳(メタデータ) (2024-06-10T22:57:27Z) - Inner-IoU: More Effective Intersection over Union Loss with Auxiliary
Bounding Box [10.03001043843768]
補助的バウンディングボックスを通してIoU損失を算出する内IoU損失を提案する。
異なるデータセットや検出器に対して、補助境界ボックスのスケールサイズを制御するためのスケーリング係数比を導入する。
最後に、シミュレーションと比較実験のために既存のIoUベースの損失関数にInner-IoUを統合する。
論文 参考訳(メタデータ) (2023-11-06T05:14:24Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Directly Optimizing IoU for Bounding Box Localization [5.018156030818881]
本稿では,バウンディングボックスに対するバウンディングボックスの検出を最大化する手法を提案する。
Smooth IoU法では、標準的なHuber損失よりもパフォーマンスが向上している。
オックスフォードIIIT、Udacityの自動運転車、PA Pets Union、VWFSの車両損傷データセットで評価されている。
論文 参考訳(メタデータ) (2023-04-14T17:08:12Z) - Wise-IoU: Bounding Box Regression Loss with Dynamic Focusing Mechanism [7.645166402471877]
Wese-IoU(WIoU)と呼ばれる動的非単調FMを用いたIoUベースの損失を提案する。
この戦略は、高品質なアンカーボックスの競争性を低減し、低品質な例によって生じる有害な勾配を低減させる。
WIoUを最先端のリアルタイム検出器YOLOv7に適用すると、MS-COCOデータセット上のAP-75は53.03%から54.50%に改善される。
論文 参考訳(メタデータ) (2023-01-24T14:50:40Z) - Rethinking IoU-based Optimization for Single-stage 3D Object Detection [103.83141677242871]
本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
論文 参考訳(メタデータ) (2022-07-19T15:35:23Z) - Bounding the Width of Neural Networks via Coupled Initialization -- A
Worst Case Analysis [121.9821494461427]
2層ReLUネットワークに必要なニューロン数を著しく削減する方法を示す。
また、事前の作業を改善するための新しい下位境界を証明し、ある仮定の下では、最善を尽くすことができることを証明します。
論文 参考訳(メタデータ) (2022-06-26T06:51:31Z) - Decoupled IoU Regression for Object Detection [31.9114940121939]
非最大抑圧(NMS)は、重複したバウンディングボックスを削除するためにオブジェクト検出パイプラインで広く使われている。
NMSの信頼性と実位置推定の信頼性の矛盾は検出性能に深刻な影響を及ぼす。
これらの問題に対処する新しいデカップリングIoU回帰モデルを提案する。
論文 参考訳(メタデータ) (2022-02-02T04:01:11Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - DM-VIO: Delayed Marginalization Visual-Inertial Odometry [62.746533939737446]
本稿では,遅延残差化とポーズグラフバンドル調整に基づく視覚慣性システムDM-VIOを提案する。
我々は,EuRoC,TUM-VI,および4Seasonsデータセットを用いて,空飛ぶドローン,大規模ハンドヘルド,自動車シナリオからなるシステムの評価を行った。
論文 参考訳(メタデータ) (2022-01-11T18:30:37Z) - Alpha-IoU: A Family of Power Intersection over Union Losses for Bounding
Box Regression [59.72580239998315]
我々は、既存のIoUベースの損失を、パワーIoU項と追加のパワー正規化項を有する新しいパワーIoU損失ファミリーに一般化する。
複数のオブジェクト検出ベンチマークとモデルの実験では、$alpha$-IoUの損失が既存のIoUベースの損失を顕著なパフォーマンスマージンで上回ることを示した。
論文 参考訳(メタデータ) (2021-10-26T13:09:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。