論文の概要: InterpIoU: Rethinking Bounding Box Regression with Interpolation-Based IoU Optimization
- arxiv url: http://arxiv.org/abs/2507.12420v1
- Date: Wed, 16 Jul 2025 17:09:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.486434
- Title: InterpIoU: Rethinking Bounding Box Regression with Interpolation-Based IoU Optimization
- Title(参考訳): InterpIoU: IoU最適化による境界ボックス回帰の再考
- Authors: Haoyuan Liu, Hiroshi Watanabe,
- Abstract要約: 補間箱と対象物の間のIoUに基づいて手作りの幾何学的罰則を置換する新しい損失関数InterpIoUを提案する。
提案手法は,様々な検出フレームワークにおいて,最先端のIoUベースの損失を一貫して上回ることを示す。
- 参考スコア(独自算出の注目度): 0.5912856130403417
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bounding box regression (BBR) is fundamental to object detection, where the regression loss is crucial for accurate localization. Existing IoU-based losses often incorporate handcrafted geometric penalties to address IoU's non-differentiability in non-overlapping cases and enhance BBR performance. However, these penalties are sensitive to box shape, size, and distribution, often leading to suboptimal optimization for small objects and undesired behaviors such as bounding box enlargement due to misalignment with the IoU objective. To address these limitations, we propose InterpIoU, a novel loss function that replaces handcrafted geometric penalties with a term based on the IoU between interpolated boxes and the target. By using interpolated boxes to bridge the gap between predictions and ground truth, InterpIoU provides meaningful gradients in non-overlapping cases and inherently avoids the box enlargement issue caused by misaligned penalties. Simulation results further show that IoU itself serves as an ideal regression target, while existing geometric penalties are both unnecessary and suboptimal. Building on InterpIoU, we introduce Dynamic InterpIoU, which dynamically adjusts interpolation coefficients based on IoU values, enhancing adaptability to scenarios with diverse object distributions. Experiments on COCO, VisDrone, and PASCAL VOC show that our methods consistently outperform state-of-the-art IoU-based losses across various detection frameworks, with particularly notable improvements in small object detection, confirming their effectiveness.
- Abstract(参考訳): 境界ボックス回帰(BBR)はオブジェクト検出に基本的であり、回帰損失は正確な位置決めに不可欠である。
既存のIoUベースの損失は、しばしば、非重複ケースにおけるIoUの非微分可能性に対処し、BBR性能を向上させるために、手作りの幾何学的罰が組み込まれている。
しかし、これらの罰則は箱の形、大きさ、分布に敏感であり、しばしば小物体の最適下最適化や、IoUの目的との相違によるボックス拡大のような望ましくない振る舞いにつながる。
これらの制約に対処するために,手作りの幾何学的罰則を補間箱と対象物の間のIoUに基づく用語に置き換える新しい損失関数InterpIoUを提案する。
補間箱を用いて予測と真実のギャップを埋めることにより、InterpIoUは重複しないケースにおいて有意義な勾配を提供し、不一致の罰則によるボックス拡大問題を回避する。
さらにシミュレーションの結果、IoU自体が理想的な回帰ターゲットとして機能し、既存の幾何学的罰則は不必要かつ準最適であることが示された。
InterpIoU上に構築されたDynamic InterpIoUは、IoU値に基づいて動的に補間係数を調整し、多様なオブジェクト分布を持つシナリオへの適応性を向上する。
COCO, VisDrone および PASCAL VOC の実験により,本手法は様々な検出フレームワークにおける最先端のIoUベースの損失を一貫して上回り,特に小型物体検出において顕著に改善し,その有効性を確認した。
関連論文リスト
- The Larger the Merrier? Efficient Large AI Model Inference in Wireless Edge Networks [56.37880529653111]
大規模計算モデル(LAIM)サービスの需要は、従来のクラウドベースの推論から、低レイテンシでプライバシ保護のアプリケーションのためのエッジベースの推論へのパラダイムシフトを推進している。
本稿では,事前学習したLAIMをデバイス上のサブモデルとサーバ上のサブモデルに分割して配置するLAIM推論方式について検討する。
論文 参考訳(メタデータ) (2025-05-14T08:18:55Z) - Marginalized Generalized IoU (MGIoU): A Unified Objective Function for Optimizing Any Convex Parametric Shapes [32.1114758137734]
Marginalized Generalized IoU (MGIoU) は、一次元正規化GIoUを計算するために、構造凸形状をその特異な形状に投影することで課題を克服する新しい損失関数である。
標準ベンチマークの実験では、MGIoUとMGIoU+は、損失遅延を10-40倍に抑えながら、既存の損失を一貫して上回っている。
論文 参考訳(メタデータ) (2025-04-23T06:05:39Z) - Unified-IoU: For High-Quality Object Detection [1.62877896907106]
そこで我々は,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
提案手法は,複数のデータセット,特にIoU閾値が高い場合において,より優れた性能を実現する。
論文 参考訳(メタデータ) (2024-08-13T04:56:45Z) - Inner-IoU: More Effective Intersection over Union Loss with Auxiliary
Bounding Box [10.03001043843768]
補助的バウンディングボックスを通してIoU損失を算出する内IoU損失を提案する。
異なるデータセットや検出器に対して、補助境界ボックスのスケールサイズを制御するためのスケーリング係数比を導入する。
最後に、シミュレーションと比較実験のために既存のIoUベースの損失関数にInner-IoUを統合する。
論文 参考訳(メタデータ) (2023-11-06T05:14:24Z) - Rethinking IoU-based Optimization for Single-stage 3D Object Detection [103.83141677242871]
本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
論文 参考訳(メタデータ) (2022-07-19T15:35:23Z) - Decoupled IoU Regression for Object Detection [31.9114940121939]
非最大抑圧(NMS)は、重複したバウンディングボックスを削除するためにオブジェクト検出パイプラインで広く使われている。
NMSの信頼性と実位置推定の信頼性の矛盾は検出性能に深刻な影響を及ぼす。
これらの問題に対処する新しいデカップリングIoU回帰モデルを提案する。
論文 参考訳(メタデータ) (2022-02-02T04:01:11Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Distribution-aware Margin Calibration for Semantic Segmentation in
Images [78.65312390695038]
ジャカードインデックス(ジャカードインデックス、Intersection-over-Union、IoU)は、画像セマンティックセグメンテーションにおいて最も重要な評価指標の一つである。
IoUスコアの直接最適化は非常に困難である。
学習目的として直接使用できるマージン校正法を提案し,データ分散に対するIoUの一般化を改良する。
論文 参考訳(メタデータ) (2021-12-21T22:38:25Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z) - PIoU Loss: Towards Accurate Oriented Object Detection in Complex
Environments [33.27663718573774]
オブジェクト指向バウンディングボックス(OBB)は、背景領域との重なりを小さくすることで、回転オブジェクトをよりターゲットにすることができる。
既存のOBBアプローチは主に、距離損失に最適化された追加次元を導入することで、水平境界ボックス検出器上に構築されている。
新たな損失である Pixels-IoU (PIoU) Loss は、正確なOBB回帰のために角度とIoUの両方を利用するように定式化されている。
論文 参考訳(メタデータ) (2020-07-19T03:51:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。