論文の概要: MPDIoU: A Loss for Efficient and Accurate Bounding Box Regression
- arxiv url: http://arxiv.org/abs/2307.07662v1
- Date: Fri, 14 Jul 2023 23:54:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 18:48:11.804211
- Title: MPDIoU: A Loss for Efficient and Accurate Bounding Box Regression
- Title(参考訳): MPDIoU: 効率的で正確なバウンディングボックス回帰の損失
- Authors: Ma Siliang, Xu Yong
- Abstract要約: 本稿では,新しい境界ボックス類似度比較基準MPDIoUを提案する。
MPDIoU損失関数は、最先端のインスタンスセグメンテーション(YOLACT)やPASCAL VOC、MS COCO、IIIT5kで訓練されたオブジェクト検出(YOLOv7)モデルに適用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bounding box regression (BBR) has been widely used in object detection and
instance segmentation, which is an important step in object localization.
However, most of the existing loss functions for bounding box regression cannot
be optimized when the predicted box has the same aspect ratio as the
groundtruth box, but the width and height values are exactly different. In
order to tackle the issues mentioned above, we fully explore the geometric
features of horizontal rectangle and propose a novel bounding box similarity
comparison metric MPDIoU based on minimum point distance, which contains all of
the relevant factors considered in the existing loss functions, namely
overlapping or non-overlapping area, central points distance, and deviation of
width and height, while simplifying the calculation process. On this basis, we
propose a bounding box regression loss function based on MPDIoU, called LMPDIoU
. Experimental results show that the MPDIoU loss function is applied to
state-of-the-art instance segmentation (e.g., YOLACT) and object detection
(e.g., YOLOv7) model trained on PASCAL VOC, MS COCO, and IIIT5k outperforms
existing loss functions.
- Abstract(参考訳): 境界ボックス回帰(BBR)は、オブジェクト検出やインスタンスセグメンテーションにおいて広く使われており、オブジェクトのローカライゼーションの重要なステップである。
しかし、予測ボックスが接地箱と同じアスペクト比を持つ場合、既存の境界箱回帰の損失関数のほとんどを最適化することはできないが、幅と高さの値は正確に異なる。
上記の問題に対処するため, 水平長方形の幾何学的特徴を網羅的に検討し, 既往の損失関数, 重複領域, 中心点距離, 幅と高さの偏差など, 既往の損失関数に考慮されたすべての要素を含む, 最小点距離に基づく新しい有界箱類似度指標MPDIoUを提案する。
そこで本研究では,MPDIoUに基づく境界ボックス回帰損失関数LMPDIoUを提案する。
実験結果から,MPDIoU損失関数は最先端のインスタンスセグメンテーション(YOLACT)やPASCAL VOC,MS COCO,IIIT5kで訓練されたオブジェクト検出(YOLOv7)モデルに適用され,既存の損失関数よりも優れていた。
関連論文リスト
- FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection [10.655167287088368]
最小点距離に基づく任意の形状比較のための新しい計量法を提案する。
FPDIoU$損失は、最先端の回転オブジェクト検出に適用される。
論文 参考訳(メタデータ) (2024-05-16T09:44:00Z) - Shape-IoU: More Accurate Metric considering Bounding Box Shape and Scale [5.8666339171606445]
形状IoU法は、バウンディングボックス自体の形状とスケールに着目して損失を算出することができる。
本手法は, 検出性能を効果的に向上し, 既存の手法よりも優れ, 異なる検出タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-12-29T16:05:02Z) - Edge Based Oriented Object Detection [8.075609633483248]
対象物の検出精度を高めるために,エッジ勾配に基づく一意な損失関数を提案する。
DOTAデータセットのmAP増加率は1.3%である。
論文 参考訳(メタデータ) (2023-09-15T09:19:38Z) - Instance-Variant Loss with Gaussian RBF Kernel for 3D Cross-modal
Retriveal [52.41252219453429]
既存の方法は全てのインスタンスを等しく扱い、同じペナルティ強度を様々な難易度を持つインスタンスに適用する。
これは曖昧な収束や局所最適性をもたらし、特徴空間の分離性を著しく妥協させる。
本稿では,異なるインスタンスに対して異なるペナルティ強度を割り当て,空間分離性を向上させるインスタンス・ヴァリアント損失を提案する。
論文 参考訳(メタデータ) (2023-05-07T10:12:14Z) - SIoU Loss: More Powerful Learning for Bounding Box Regression [0.0]
損失関数SIoUが提案され、所望の回帰のベクトルの角度を考慮してペナルティ指標が再定義された。
従来のニューラルネットワークやデータセットに適用すると、SIoUはトレーニングの速度と推論の精度の両方を改善する。
論文 参考訳(メタデータ) (2022-05-25T12:46:21Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Focal and Efficient IOU Loss for Accurate Bounding Box Regression [63.14659624634066]
オブジェクト検出では、境界ボックス回帰(BBR)はオブジェクトローカリゼーションのパフォーマンスを決定する重要なステップです。
i) $ell_n$-norm と IOU ベースのロス関数はどちらも BBR の目的を描くのに非効率的であり、これは遅い収束と不正確な回帰結果をもたらす。
論文 参考訳(メタデータ) (2021-01-20T14:33:58Z) - Canny-VO: Visual Odometry with RGB-D Cameras based on Geometric 3D-2D
Edge Alignment [85.32080531133799]
本稿では,自由形式の曲線登録に関する古典的な問題をレビューし,効率的なrgbdビジュアルオドメトリシステムcanny-voに適用する。
エッジ登録でよく用いられる距離変換の代替として、近似近接近傍場と配向近接近傍場という2つの方法が提案されている。
3D2Dエッジアライメントは、効率性と精度の両方の観点から、これらの代替製剤の恩恵を受けます。
論文 参考訳(メタデータ) (2020-12-15T11:42:17Z) - Enhancing Geometric Factors in Model Learning and Inference for Object
Detection and Instance Segmentation [91.12575065731883]
境界ボックス回帰および非最大抑圧(NMS)における幾何学的要素の強化を目的とした完全IoU損失とクラスタNMSを提案する。
CIoU損失を用いたディープラーニングモデルのトレーニングは、広く採用されている$ell_n$-norm損失とIoUベースの損失と比較して、一貫性のあるAPとARの改善をもたらす。
クラスタ-NMSは、純粋なGPU実装のため非常に効率的であり、APとARの両方を改善するために幾何学的要素を組み込むことができる。
論文 参考訳(メタデータ) (2020-05-07T16:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。