論文の概要: Enhancing Geometric Factors in Model Learning and Inference for Object
Detection and Instance Segmentation
- arxiv url: http://arxiv.org/abs/2005.03572v4
- Date: Mon, 5 Jul 2021 08:21:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 23:43:22.062126
- Title: Enhancing Geometric Factors in Model Learning and Inference for Object
Detection and Instance Segmentation
- Title(参考訳): モデル学習における幾何学的要素の強化とオブジェクト検出とインスタンスセグメンテーションの推論
- Authors: Zhaohui Zheng and Ping Wang and Dongwei Ren and Wei Liu and Rongguang
Ye and Qinghua Hu and Wangmeng Zuo
- Abstract要約: 境界ボックス回帰および非最大抑圧(NMS)における幾何学的要素の強化を目的とした完全IoU損失とクラスタNMSを提案する。
CIoU損失を用いたディープラーニングモデルのトレーニングは、広く採用されている$ell_n$-norm損失とIoUベースの損失と比較して、一貫性のあるAPとARの改善をもたらす。
クラスタ-NMSは、純粋なGPU実装のため非常に効率的であり、APとARの両方を改善するために幾何学的要素を組み込むことができる。
- 参考スコア(独自算出の注目度): 91.12575065731883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based object detection and instance segmentation have achieved
unprecedented progress. In this paper, we propose Complete-IoU (CIoU) loss and
Cluster-NMS for enhancing geometric factors in both bounding box regression and
Non-Maximum Suppression (NMS), leading to notable gains of average precision
(AP) and average recall (AR), without the sacrifice of inference efficiency. In
particular, we consider three geometric factors, i.e., overlap area, normalized
central point distance and aspect ratio, which are crucial for measuring
bounding box regression in object detection and instance segmentation. The
three geometric factors are then incorporated into CIoU loss for better
distinguishing difficult regression cases. The training of deep models using
CIoU loss results in consistent AP and AR improvements in comparison to widely
adopted $\ell_n$-norm loss and IoU-based loss. Furthermore, we propose
Cluster-NMS, where NMS during inference is done by implicitly clustering
detected boxes and usually requires less iterations. Cluster-NMS is very
efficient due to its pure GPU implementation, and geometric factors can be
incorporated to improve both AP and AR. In the experiments, CIoU loss and
Cluster-NMS have been applied to state-of-the-art instance segmentation (e.g.,
YOLACT and BlendMask-RT), and object detection (e.g., YOLO v3, SSD and Faster
R-CNN) models. Taking YOLACT on MS COCO as an example, our method achieves
performance gains as +1.7 AP and +6.2 AR$_{100}$ for object detection, and +0.9
AP and +3.5 AR$_{100}$ for instance segmentation, with 27.1 FPS on one NVIDIA
GTX 1080Ti GPU. All the source code and trained models are available at
https://github.com/Zzh-tju/CIoU
- Abstract(参考訳): ディープラーニングに基づくオブジェクト検出とインスタンスセグメンテーションは前例のない進歩を遂げた。
本稿では,有界箱回帰と非最大抑圧の双方における幾何学的要因の強化を目的とした完全IoU損失(CIoU)とクラスタNMS(Cluster-NMS)を提案し,推定効率を犠牲にすることなく平均精度(AP)と平均リコール(AR)の顕著な向上をもたらす。
特に,重なり領域,正規化中心点距離,アスペクト比の3つの幾何学的要因を考察し,物体検出とインスタンス分割における境界ボックス回帰の測定に不可欠である。
次に、3つの幾何学的要因をCIoU損失に組み込んで、難しい回帰ケースをよりよく区別する。
CIoU損失を用いたディープラーニングモデルのトレーニングは、広く採用されている$\ell_n$-norm損失とIoUベースの損失と比較して、一貫性のあるAPとARの改善をもたらす。
さらに,検出されたボックスを暗黙的にクラスタリングすることで推論中のNMSを行うクラスタNMSを提案する。
クラスタ-NMSは、純粋なGPU実装のため非常に効率的であり、APとARの両方を改善するために幾何学的要素を組み込むことができる。
実験ではCIoU損失とCluster-NMSが最先端のインスタンスセグメンテーション(YOLACTやBlendMask-RTなど)やオブジェクト検出(YOLO v3、SSD、Faster R-CNNなど)に応用されている。
例えば、MS COCO上でYOLACTを利用すると、オブジェクト検出に+1.7 APと+6.2 AR$_{100}$、インスタンスセグメンテーションに+0.9 APと+3.5 AR$_{100}$、NVIDIA GTX 1080 Ti GPUに27.1 FPS、などのパフォーマンス向上が得られる。
すべてのソースコードとトレーニングされたモデルはhttps://github.com/Zzh-tju/CIoUで入手できる。
関連論文リスト
- Unified Gradient-Based Machine Unlearning with Remain Geometry Enhancement [29.675650285351768]
深層ニューラルネットワークのプライバシーと信頼性を高めるために、機械学習(MU)が登場した。
近似MUは大規模モデルの実用的手法である。
本稿では,最新の学習方向を暗黙的に近似する高速スローパラメータ更新手法を提案する。
論文 参考訳(メタデータ) (2024-09-29T15:17:33Z) - Real-Time 3D Occupancy Prediction via Geometric-Semantic Disentanglement [8.592248643229675]
運転予測は自律運転(AD)において重要な役割を担っている
既存の手法はしばしば高い計算コストを発生させるが、これはADのリアルタイム要求と矛盾する。
ハイブリッドBEV-Voxel表現を用いた幾何学的意味的デュアルブランチネットワーク(GSDBN)を提案する。
論文 参考訳(メタデータ) (2024-07-18T04:46:13Z) - Rethinking IoU-based Optimization for Single-stage 3D Object Detection [103.83141677242871]
本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
論文 参考訳(メタデータ) (2022-07-19T15:35:23Z) - Improved Aggregating and Accelerating Training Methods for Spatial Graph
Neural Networks on Fraud Detection [0.0]
本稿では,CARE-GNNをResidual Layered CARE-GNN(RLC-GNN)と呼ばれるディープモデルに拡張する改良されたディープアーキテクチャを提案する。
RLC-GNNの3つの課題は、近隣情報の利用が制限に達すること、訓練の難しさ、およびノードの特徴や外部パターンに関する包括的な考慮の欠如である。
YelpとAmazonのデータセットで実験が行われる。
論文 参考訳(メタデータ) (2022-02-14T09:51:35Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - INSTA-YOLO: Real-Time Instance Segmentation [2.726684740197893]
Insta-YOLOは,リアルタイムインスタンス分割のための一段階のエンドツーエンドディープラーニングモデルである。
提案モデルはYOLOワンショットオブジェクト検出器にインスパイアされ,ボックス回帰損失はローカライゼーションヘッドの回帰に置き換わる。
当社のモデルは,Carnva,Cityscapes,Airbusの3つのデータセットで評価する。
論文 参考訳(メタデータ) (2021-02-12T21:17:29Z) - Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.48110331544885]
既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。
我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。
論文 参考訳(メタデータ) (2020-12-14T13:12:38Z) - EOLO: Embedded Object Segmentation only Look Once [0.0]
3つの独立したブランチで概念的にシンプルであり、完全に畳み込み可能で、モバイルや組み込みデバイスに簡単に組み込むことができるアンカーフリーでシングルショットのインスタンスセグメンテーション手法を導入する。
EOLOと呼ばれる本手法では,各画素のインスタンス中心分類と4次元距離回帰により,意味的セグメンテーションを予測し,重なり合うオブジェクト問題を区別するものとして,インスタンス分割問題を再構成する。
ベルとホイッスルがなければ、EOLOはIoU50の下で27.7$%のマスクmAPを獲得し、1080Ti GPU上で30FPSに達し、シングルモデルとシングルスケールのトレーニング/テストが可能である。
論文 参考訳(メタデータ) (2020-03-31T21:22:05Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。