論文の概要: Directly Optimizing IoU for Bounding Box Localization
- arxiv url: http://arxiv.org/abs/2304.07256v1
- Date: Fri, 14 Apr 2023 17:08:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 12:49:32.222598
- Title: Directly Optimizing IoU for Bounding Box Localization
- Title(参考訳): ボックスローカライゼーションにおけるIoUの直接最適化
- Authors: Mofassir ul Islam Arif, Mohsan Jameel, and Lars Schmidt-Thieme
- Abstract要約: 本稿では,バウンディングボックスに対するバウンディングボックスの検出を最大化する手法を提案する。
Smooth IoU法では、標準的なHuber損失よりもパフォーマンスが向上している。
オックスフォードIIIT、Udacityの自動運転車、PA Pets Union、VWFSの車両損傷データセットで評価されている。
- 参考スコア(独自算出の注目度): 5.018156030818881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection has seen remarkable progress in recent years with the
introduction of Convolutional Neural Networks (CNN). Object detection is a
multi-task learning problem where both the position of the objects in the
images as well as their classes needs to be correctly identified. The idea here
is to maximize the overlap between the ground-truth bounding boxes and the
predictions i.e. the Intersection over Union (IoU). In the scope of work seen
currently in this domain, IoU is approximated by using the Huber loss as a
proxy but this indirect method does not leverage the IoU information and treats
the bounding box as four independent, unrelated terms of regression. This is
not true for a bounding box where the four coordinates are highly correlated
and hold a semantic meaning when taken together. The direct optimization of the
IoU is not possible due to its non-convex and non-differentiable nature. In
this paper, we have formulated a novel loss namely, the Smooth IoU, which
directly optimizes the IoUs for the bounding boxes. This loss has been
evaluated on the Oxford IIIT Pets, Udacity self-driving car, PASCAL VOC, and
VWFS Car Damage datasets and has shown performance gains over the standard
Huber loss.
- Abstract(参考訳): オブジェクト検出は近年,畳み込みニューラルネットワーク(CNN)の導入によって顕著な進歩を遂げている。
オブジェクト検出は、画像内のオブジェクトの位置とクラスの両方を正しく識別する必要があるマルチタスク学習問題である。
ここでの考え方は、接地と接地の境界箱の重なり合いを最大化することであり、すなわち連合の断面積(IoU)の予測である。
現在この領域で見られる作業の範囲では、IoUはHuber損失をプロキシとして利用することで近似されるが、この間接的手法はIoU情報を活用せず、バウンディングボックスを4つの独立無関係な回帰項として扱う。
これは、4つの座標が高い相関関係にあり、結合すると意味的な意味を持つ境界ボックスには当てはまらない。
iou の直接最適化は、その非凸かつ非微分可能性のため不可能である。
本稿では,IoU をバウンディングボックスに直接最適化する新しい損失 Smooth IoU を定式化した。
この損失はOxford IIIT Pets、Udacityの自動運転車、PASCAL VOC、VWFSの車両損傷データセットで評価され、標準的なハマー損失よりもパフォーマンスが向上した。
関連論文リスト
- Unified-IoU: For High-Quality Object Detection [1.62877896907106]
そこで我々は,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
提案手法は,複数のデータセット,特にIoU閾値が高い場合において,より優れた性能を実現する。
論文 参考訳(メタデータ) (2024-08-13T04:56:45Z) - Inner-IoU: More Effective Intersection over Union Loss with Auxiliary
Bounding Box [10.03001043843768]
補助的バウンディングボックスを通してIoU損失を算出する内IoU損失を提案する。
異なるデータセットや検出器に対して、補助境界ボックスのスケールサイズを制御するためのスケーリング係数比を導入する。
最後に、シミュレーションと比較実験のために既存のIoUベースの損失関数にInner-IoUを統合する。
論文 参考訳(メタデータ) (2023-11-06T05:14:24Z) - Knowledge Combination to Learn Rotated Detection Without Rotated
Annotation [53.439096583978504]
回転バウンディングボックスは、伸長したオブジェクトの出力あいまいさを劇的に減少させる。
この効果にもかかわらず、回転検出器は広く使われていない。
本稿では,モデルが正確な回転ボックスを予測できるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-05T03:07:36Z) - Rethinking IoU-based Optimization for Single-stage 3D Object Detection [103.83141677242871]
本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
論文 参考訳(メタデータ) (2022-07-19T15:35:23Z) - Decoupled IoU Regression for Object Detection [31.9114940121939]
非最大抑圧(NMS)は、重複したバウンディングボックスを削除するためにオブジェクト検出パイプラインで広く使われている。
NMSの信頼性と実位置推定の信頼性の矛盾は検出性能に深刻な影響を及ぼす。
これらの問題に対処する新しいデカップリングIoU回帰モデルを提案する。
論文 参考訳(メタデータ) (2022-02-02T04:01:11Z) - Distribution-aware Margin Calibration for Semantic Segmentation in
Images [78.65312390695038]
ジャカードインデックス(ジャカードインデックス、Intersection-over-Union、IoU)は、画像セマンティックセグメンテーションにおいて最も重要な評価指標の一つである。
IoUスコアの直接最適化は非常に困難である。
学習目的として直接使用できるマージン校正法を提案し,データ分散に対するIoUの一般化を改良する。
論文 参考訳(メタデータ) (2021-12-21T22:38:25Z) - A Systematic IoU-Related Method: Beyond Simplified Regression for Better
Localization [9.036025934093965]
本稿では,2つのボックスが重なり合っていない場合によく定義され,重なり合っているときに標準IoUに還元される拡張IoUを提案する。
第3に、最小限のEIoU損失をより安定かつスムーズに接近させる安定最適化手法(SOT)を提案する。
論文 参考訳(メタデータ) (2021-12-03T09:00:55Z) - Momentum Contrastive Autoencoder: Using Contrastive Learning for Latent
Space Distribution Matching in WAE [51.09507030387935]
Wasserstein autoencoder (WAE) は、2つの分布が一致することは、このAEの潜在空間が予め指定された事前分布と一致するという制約の下で、単純なオートエンコーダ(AE)損失を最小限にすることと同値であることを示している。
本稿では,この問題を解決する手段として,自己指導型表現学習に有効であることを示すコントラスト学習フレームワークを提案する。
WAEの損失を最適化するために、対照的な学習フレームワークを使用することで、WAEの一般的なアルゴリズムと比較して、より高速に収束し、より安定した最適化が達成できることを示す。
論文 参考訳(メタデータ) (2021-10-19T22:55:47Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - 3D IoU-Net: IoU Guided 3D Object Detector for Point Clouds [68.44740333471792]
正規分類と回帰分岐に3D IoU予測分岐を付加する。
我々は,IoU感度特徴学習とIoUアライメント操作を併用した3次元IoU-Netを提案する。
KITTIカー検出ベンチマークの実験結果から,IoU知覚による3次元IoU-Netが最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2020-04-10T09:24:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。