論文の概要: W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection
- arxiv url: http://arxiv.org/abs/2207.12104v1
- Date: Mon, 25 Jul 2022 12:13:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:52:41.000131
- Title: W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection
- Title(参考訳): W2N:オブジェクト検出のための弱スーパービジョンからノイズスーパービジョンへ
- Authors: Zitong Huang, Yiping Bao, Bowen Dong, Erjin Zhou, Wangmeng Zuo
- Abstract要約: 弱い監督からうるさい監督(W2N)に切り替える新しいパラダイムを持つ新しいWSODフレームワークを提案する。
ローカライズ適応モジュールでは、元の擬似接地構造における識別部分の割合を減らすために正規化損失を提案する。
我々のW2Nは、既存の純粋なWSODメソッドや転送学習メソッドよりも優れています。
- 参考スコア(独自算出の注目度): 64.10643170523414
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Weakly-supervised object detection (WSOD) aims to train an object detector
only requiring the image-level annotations. Recently, some works have managed
to select the accurate boxes generated from a well-trained WSOD network to
supervise a semi-supervised detection framework for better performance.
However, these approaches simply divide the training set into labeled and
unlabeled sets according to the image-level criteria, such that sufficient
mislabeled or wrongly localized box predictions are chosen as pseudo
ground-truths, resulting in a sub-optimal solution of detection performance. To
overcome this issue, we propose a novel WSOD framework with a new paradigm that
switches from weak supervision to noisy supervision (W2N). Generally, with
given pseudo ground-truths generated from the well-trained WSOD network, we
propose a two-module iterative training algorithm to refine pseudo labels and
supervise better object detector progressively. In the localization adaptation
module, we propose a regularization loss to reduce the proportion of
discriminative parts in original pseudo ground-truths, obtaining better pseudo
ground-truths for further training. In the semi-supervised module, we propose a
two tasks instance-level split method to select high-quality labels for
training a semi-supervised detector. Experimental results on different
benchmarks verify the effectiveness of W2N, and our W2N outperforms all
existing pure WSOD methods and transfer learning methods. Our code is publicly
available at https://github.com/1170300714/w2n_wsod.
- Abstract(参考訳): weakly-supervised object detection (wsod)は、画像レベルのアノテーションのみを必要とするオブジェクト検出器をトレーニングすることを目的としている。
近年、よく訓練されたWSODネットワークから生成された正確なボックスを選択して、性能向上のための半教師付き検出フレームワークを監督する作業が行われている。
しかしながら、これらのアプローチは単にトレーニングセットを画像レベルの基準に従ってラベル付きとラベルなしのセットに分割し、十分な誤ったラベル付きまたは間違った局所化されたボックス予測を疑似グランドルースとして選択することで、検出性能の最適解となる。
この問題を克服するため,我々は,弱い監視からノイズの監視(w2n)に切り替える新しいパラダイムを持つ新しいwsodフレームワークを提案する。
一般に,十分に訓練されたwsodネットワークから生成された擬似基底構造を用いて,擬似ラベルを洗練し,より優れた物体検出を進行的に監督する2モジュール反復学習アルゴリズムを提案する。
ローカライズ適応モジュールでは,従来の擬似接地トラスにおける識別的部分の割合を減少させる正規化損失を提案し,さらなる訓練のためにより良い擬似接地トラスを得る。
半教師付きモジュールでは、半教師付き検出器を訓練するための高品質ラベルを選択するための2つのタスクのインスタンスレベルの分割手法を提案する。
異なるベンチマークによる実験結果からW2Nの有効性が検証され,W2Nは既存の純粋なWSOD法や伝達学習法よりも優れていた。
私たちのコードはhttps://github.com/1170300714/w2n_wsodで公開されています。
関連論文リスト
- Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Mind the Gap: Polishing Pseudo labels for Accurate Semi-supervised
Object Detection [18.274860417877093]
半教師対象検出(SSOD)のための二重擬似ラベル研磨フレームワークを提案する。
教師検出器が生成する擬似ラベルを直接利用するのではなく, 地平からの逸脱を減らすための最初の試みを行う。
これにより、どちらの研磨ネットワークも、アノテーションのないオブジェクトに対してより正確な擬似ラベルを推測することができる。
論文 参考訳(メタデータ) (2022-07-17T14:07:49Z) - Label, Verify, Correct: A Simple Few Shot Object Detection Method [93.84801062680786]
トレーニングセットから高品質な擬似アノテーションを抽出するための簡単な擬似ラベリング手法を提案する。
擬似ラベリングプロセスの精度を向上させるための2つの新しい手法を提案する。
提案手法は,既存手法と比較して,最先端ないし第2の性能を実現する。
論文 参考訳(メタデータ) (2021-12-10T18:59:06Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Point Cloud Instance Segmentation with Semi-supervised Bounding-Box
Mining [17.69745159912481]
ラベル付きおよび未ラベルのバウンディングボックスを監視として使用した,最初の半教師付きポイントクラウドインスタンスセグメンテーションフレームワーク(SPIB)を紹介した。
提案手法は,近年の完全教師付き手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2021-11-30T08:40:40Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。