論文の概要: Unified-IoU: For High-Quality Object Detection
- arxiv url: http://arxiv.org/abs/2408.06636v1
- Date: Tue, 13 Aug 2024 04:56:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-14 18:36:27.423703
- Title: Unified-IoU: For High-Quality Object Detection
- Title(参考訳): Unified-IoU: 高品質なオブジェクト検出
- Authors: Xiangjie Luo, Zhihao Cai, Bo Shao, Yingxun Wang,
- Abstract要約: そこで我々は,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
提案手法は,複数のデータセット,特にIoU閾値が高い場合において,より優れた性能を実現する。
- 参考スコア(独自算出の注目度): 1.62877896907106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection is an important part in the field of computer vision, and the effect of object detection is directly determined by the regression accuracy of the prediction box. As the key to model training, IoU (Intersection over Union) greatly shows the difference between the current prediction box and the Ground Truth box. Subsequent researchers have continuously added more considerations to IoU, such as center distance, aspect ratio, and so on. However, there is an upper limit to just refining the geometric differences; And there is a potential connection between the new consideration index and the IoU itself, and the direct addition or subtraction between the two may lead to the problem of "over-consideration". Based on this, we propose a new IoU loss function, called Unified-IoU (UIoU), which is more concerned with the weight assignment between different quality prediction boxes. Specifically, the loss function dynamically shifts the model's attention from low-quality prediction boxes to high-quality prediction boxes in a novel way to enhance the model's detection performance on high-precision or intensive datasets and achieve a balance in training speed. Our proposed method achieves better performance on multiple datasets, especially at a high IoU threshold, UIoU has a more significant improvement effect compared with other improved IoU losses. Our code is publicly available at: https://github.com/lxj-drifter/UIOU_files.
- Abstract(参考訳): 物体検出はコンピュータビジョンの分野において重要な部分であり、物体検出の効果は予測ボックスの回帰精度によって直接決定される。
モデルトレーニングの鍵として、IoU (Intersection over Union) は現在の予測ボックスとグラウンドトゥルースボックスの差を大きく示す。
その後の研究者は、中心距離やアスペクト比など、IoUにさらに多くの考察を加えてきた。
しかし、幾何学的な違いを補うには上限がある; そして、新しい考慮指標とIoU自身の間には潜在的なつながりがあり、2つの間の直接の加算または減算は「過剰な考察」の問題につながるかもしれない。
そこで本研究では,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
具体的には、損失関数は、モデルの注意を低品質の予測ボックスから高品質の予測ボックスに動的にシフトさせ、高精度または集中的なデータセット上でのモデルの検出性能を高め、トレーニング速度のバランスを達成する。
提案手法は複数のデータセット,特に高IoUしきい値において,UIoUが他の改良IoU損失よりも有意に改善する。
私たちのコードは、https://github.com/lxj-drifter/UIOU_files.comで公開されています。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Decoupled and Interactive Regression Modeling for High-performance One-stage 3D Object Detection [8.531052087985097]
回帰タスクにおけるバウンディングボックスモデリングの不十分さは、1段階の3Dオブジェクト検出の性能を制約する。
一段階検出のための疎結合・インタラクティブ回帰モデリング(DIRM)を提案する。
論文 参考訳(メタデータ) (2024-09-01T10:47:22Z) - Directly Optimizing IoU for Bounding Box Localization [5.018156030818881]
本稿では,バウンディングボックスに対するバウンディングボックスの検出を最大化する手法を提案する。
Smooth IoU法では、標準的なHuber損失よりもパフォーマンスが向上している。
オックスフォードIIIT、Udacityの自動運転車、PA Pets Union、VWFSの車両損傷データセットで評価されている。
論文 参考訳(メタデータ) (2023-04-14T17:08:12Z) - Rethinking IoU-based Optimization for Single-stage 3D Object Detection [103.83141677242871]
本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
論文 参考訳(メタデータ) (2022-07-19T15:35:23Z) - Decoupled IoU Regression for Object Detection [31.9114940121939]
非最大抑圧(NMS)は、重複したバウンディングボックスを削除するためにオブジェクト検出パイプラインで広く使われている。
NMSの信頼性と実位置推定の信頼性の矛盾は検出性能に深刻な影響を及ぼす。
これらの問題に対処する新しいデカップリングIoU回帰モデルを提案する。
論文 参考訳(メタデータ) (2022-02-02T04:01:11Z) - Distribution-aware Margin Calibration for Semantic Segmentation in
Images [78.65312390695038]
ジャカードインデックス(ジャカードインデックス、Intersection-over-Union、IoU)は、画像セマンティックセグメンテーションにおいて最も重要な評価指標の一つである。
IoUスコアの直接最適化は非常に困難である。
学習目的として直接使用できるマージン校正法を提案し,データ分散に対するIoUの一般化を改良する。
論文 参考訳(メタデータ) (2021-12-21T22:38:25Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z) - 3D IoU-Net: IoU Guided 3D Object Detector for Point Clouds [68.44740333471792]
正規分類と回帰分岐に3D IoU予測分岐を付加する。
我々は,IoU感度特徴学習とIoUアライメント操作を併用した3次元IoU-Netを提案する。
KITTIカー検出ベンチマークの実験結果から,IoU知覚による3次元IoU-Netが最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2020-04-10T09:24:29Z) - Seeing without Looking: Contextual Rescoring of Object Detections for AP
Maximization [4.346179456029563]
任意の検出器の出力を後処理することで、コンテキストをオブジェクト検出に組み込むことを提案する。
再現は、検出の集合全体からコンテキスト情報を条件付けすることで行われる。
検出信頼度を簡易に再割り当てすることでAPを改善できることを示す。
論文 参考訳(メタデータ) (2019-12-27T18:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。