論文の概要: 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation
- arxiv url: http://arxiv.org/abs/2003.07557v1
- Date: Tue, 17 Mar 2020 06:45:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:21:36.856022
- Title: 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation
- Title(参考訳): 1st Place Solutions for OpenImage2019 -- オブジェクト検出とインスタンスのセグメンテーション
- Authors: Yu Liu, Guanglu Song, Yuhang Zang, Yan Gao, Enze Xie, Junjie Yan, Chen
Change Loy, Xiaogang Wang
- Abstract要約: この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
- 参考スコア(独自算出の注目度): 116.25081559037872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article introduces the solutions of the two champion teams, `MMfruit'
for the detection track and `MMfruitSeg' for the segmentation track, in
OpenImage Challenge 2019. It is commonly known that for an object detector, the
shared feature at the end of the backbone is not appropriate for both
classification and regression, which greatly limits the performance of both
single stage detector and Faster RCNN \cite{ren2015faster} based detector. In
this competition, we observe that even with a shared feature, different
locations in one object has completely inconsistent performances for the two
tasks. \textit{E.g. the features of salient locations are usually good for
classification, while those around the object edge are good for regression.}
Inspired by this, we propose the Decoupling Head (DH) to disentangle the object
classification and regression via the self-learned optimal feature extraction,
which leads to a great improvement. Furthermore, we adjust the soft-NMS
algorithm to adj-NMS to obtain stable performance improvement. Finally, a
well-designed ensemble strategy via voting the bounding box location and
confidence is proposed. We will also introduce several training/inferencing
strategies and a bag of tricks that give minor improvement. Given those masses
of details, we train and aggregate 28 global models with various backbones,
heads and 3+2 expert models, and achieves the 1st place on the OpenImage 2019
Object Detection Challenge on the both public and private leadboards. Given
such good instance bounding box, we further design a simple instance-level
semantic segmentation pipeline and achieve the 1st place on the segmentation
challenge.
- Abstract(参考訳): この記事では,検出トラックの‘MMfruit’とセグメンテーショントラックの‘MMfruitSeg’という2つのチャンピオンチームのソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、物体検出器では、バックボーンの端の共有機能は分類と回帰の両方に適さないことが知られており、これは単一ステージ検出器と高速RCNN \cite{ren2015faster} ベースの検出器の性能を大幅に制限している。
このコンペティションでは、共有機能がある場合でも、ひとつのオブジェクト内の異なる位置が2つのタスクに対して完全に矛盾するパフォーマンスを持つことが観察される。
例えば、サルエントな位置の特徴は分類に適していますが、オブジェクトエッジの周りの特徴は回帰に適しています。
このことから着想を得たdh(decoupling head)は,自己学習した最適特徴抽出によって対象の分類と回帰を解消し,大きな改善をもたらす。
さらに,ソフトNMSアルゴリズムを adj-NMS に調整し,安定した性能向上を実現する。
最後に,境界ボックスの位置と信頼度を投票することで,適切に設計されたアンサンブル戦略を提案する。
私たちはまた、いくつかのトレーニング/会議戦略と小さな改善をもたらすトリックの袋も導入します。
さまざまなバックボーン、ヘッド、3+2の専門家モデルを備えた28のグローバルモデルをトレーニングし、集約し、パブリックとプライベートの両方のリードボード上で、OpenImage 2019 Object Detection Challengeで1位を獲得します。
このような良いインスタンス境界ボックスを考えると、単純なインスタンスレベルのセマンティクスセグメンテーションパイプラインを更に設計し、セグメンテーションチャレンジの第1位を達成する。
関連論文リスト
- Instance Segmentation under Occlusions via Location-aware Copy-Paste
Data Augmentation [8.335108002480068]
MMSports 2023 DeepSportRadarは、バスケットボールのコンテキスト内での人間の対象のセグメンテーションに焦点を当てたデータセットを導入した。
この課題は、堅牢なデータ拡張技術と賢明なディープラーニングアーキテクチャの適用を必要とする。
我々の研究(コンペで1位)は、まず、より広い分布でより多くのトレーニングサンプルを生成することのできる、新しいデータ拡張技術を提案する。
論文 参考訳(メタデータ) (2023-10-27T07:44:25Z) - 1st Place Solution of The Robust Vision Challenge (RVC) 2022 Semantic
Segmentation Track [67.56316745239629]
本報告では,ECCV 2022におけるロバストビジョンチャレンジのセマンティックセグメンテーション課題に対する勝利解について述べる。
本手法では,エンコーダとしてFAN-B-Hybridモデルを採用し,セグメンテーションフレームワークとしてSegformerを使用している。
提案手法は,マルチドメインセグメンテーションタスクの強力なベースラインとして機能し,今後の作業に役立てることができる。
論文 参考訳(メタデータ) (2022-10-23T20:52:22Z) - Group R-CNN for Weakly Semi-supervised Object Detection with Points [18.720915213798623]
本稿では,グループR-CNNの効率的なポイントツーボックス回帰器を提案する。
グループR-CNNはまず、各ポイントアノテーションに対する提案のグループを生成するために、インスタンスレベルの提案グループを使用する。
我々は,グループR-CNNが先行手法であるポイントDETRの3.9mAPと5%の良好なラベル付き画像より有意に優れていたことを示す。
論文 参考訳(メタデータ) (2022-05-12T07:17:54Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z) - Labels4Free: Unsupervised Segmentation using StyleGAN [40.39780497423365]
本稿では,StyleGAN生成オブジェクトに対する教師なしセグメンテーションフレームワークを提案する。
最先端の教師付きセグメンテーションネットワークに対する比較結果について報告する。
論文 参考訳(メタデータ) (2021-03-27T18:59:22Z) - CompFeat: Comprehensive Feature Aggregation for Video Instance
Segmentation [67.17625278621134]
ビデオインスタンスのセグメンテーションは、特定のビデオのそれぞれのオブジェクトを検出し、セグメンテーションし、追跡する必要がある複雑なタスクです。
従来のアプローチは、オブジェクトの検出、セグメンテーション、追跡にのみシングルフレーム機能を使用します。
本稿では,時間的および空間的コンテキスト情報を用いて,フレームレベルとオブジェクトレベルでの機能を洗練する新しい包括的特徴集約アプローチ(compfeat)を提案する。
論文 参考訳(メタデータ) (2020-12-07T00:31:42Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Deep Variational Instance Segmentation [7.334808870313923]
State-of-the-artアルゴリズムは、しばしば2つの別々のステージを使用し、最初の1つはオブジェクトの提案を生成し、もう1つは境界を認識して修正する。
完全畳み込みネットワーク(FCN)を直接利用して,インスタンスラベルを予測する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-22T17:57:49Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - Revisiting the Sibling Head in Object Detector [24.784483589579896]
本稿では,兄弟頭部の2つの対象関数間の空間的不整合がトレーニング過程を著しく損なうことを観察する。
分類と回帰を考えると、TSDは2つの非絡み合った提案を生成することによって空間次元からそれらを分離する。
驚いたことに、このシンプルなデザインは、MS COCOとGoogle OpenImageの両方のバックボーンとモデルを、一貫して3%のmAPで強化することができる。
論文 参考訳(メタデータ) (2020-03-17T05:21:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。