論文の概要: WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2105.11293v1
- Date: Fri, 21 May 2021 11:58:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 15:10:11.373191
- Title: WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection
- Title(参考訳): WSSOD: 弱さと半監督オブジェクト検出のための新しいパイプライン
- Authors: Shijie Fang, Yuhang Cao, Xinjiang Wang, Kai Chen, Dahua Lin, Wayne
Zhang
- Abstract要約: 弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
- 参考スコア(独自算出の注目度): 75.80075054706079
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of object detection, to a great extent, depends on the
availability of large annotated datasets. To alleviate the annotation cost, the
research community has explored a number of ways to exploit unlabeled or weakly
labeled data. However, such efforts have met with limited success so far. In
this work, we revisit the problem with a pragmatic standpoint, trying to
explore a new balance between detection performance and annotation cost by
jointly exploiting fully and weakly annotated data. Specifically, we propose a
weakly- and semi-supervised object detection framework (WSSOD), which involves
a two-stage learning procedure. An agent detector is first trained on a joint
dataset and then used to predict pseudo bounding boxes on weakly-annotated
images. The underlying assumptions in the current as well as common
semi-supervised pipelines are also carefully examined under a unified EM
formulation. On top of this framework, weakly-supervised loss (WSL), label
attention and random pseudo-label sampling (RPS) strategies are introduced to
relax these assumptions, bringing additional improvement on the efficacy of the
detection pipeline. The proposed framework demonstrates remarkable performance
on PASCAL-VOC and MSCOCO benchmark, achieving a high performance comparable to
those obtained in fully-supervised settings, with only one third of the
annotations.
- Abstract(参考訳): オブジェクト検出のパフォーマンスは、大きな注釈付きデータセットの可用性に大きく依存します。
アノテーションのコストを軽減するため、研究コミュニティはラベルなしまたは弱いラベル付きデータを活用する方法を数多く検討してきた。
しかし、このような努力は今のところ限られた成功を収めている。
本研究では,完全かつ弱く注釈付きデータを共同利用することにより,検出性能とアノテーションコストの新たなバランスを探究し,実用的視点で問題を再検討する。
具体的には,2段階の学習手順を含む弱機能かつ半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
電流と一般的な半教師付きパイプラインの仮定は、統一EM定式化の下で慎重に検討される。
このフレームワーク上には、弱教師付き損失(WSL)、ラベルアテンション、ランダム擬似ラベルサンプリング(RPS)戦略を導入し、これらの仮定を緩和し、検出パイプラインの有効性をさらに改善する。
提案フレームワークはPASCAL-VOCとMSCOCOのベンチマークで顕著な性能を示し,アノテーションの3分の1に過ぎなかった。
関連論文リスト
- ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Weakly-Supervised Cross-Domain Segmentation of Electron Microscopy with Sparse Point Annotation [1.124958340749622]
カウント,検出,セグメンテーションタスク間の相関を利用したマルチタスク学習フレームワークを提案する。
ラベル拡張のためのクロスポジションカット・アンド・ペーストを開発し,エントロピーに基づく擬似ラベル選択を行う。
提案手法は, UDA法を著しく上回り, 教師付き手法と同等の性能を発揮する。
論文 参考訳(メタデータ) (2024-03-31T12:22:23Z) - Sparse Generation: Making Pseudo Labels Sparse for weakly supervision with points [2.2241974678268903]
モデルのスパース出力の結果、弱教師付き擬似ラベルの生成を考える。
擬似ラベルをスパース化するスパース生成法を提案する。
論文 参考訳(メタデータ) (2024-03-28T10:42:49Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - LEDetection: A Simple Framework for Semi-Supervised Few-Shot Object
Detection [4.3512163406552]
本稿では,ベースラベルと新規ラベルが同時に不足する現実的なシナリオを考慮し,半教師付きFSODの新たな課題について考察する。
我々は、疑似ラベルと地域提案の一貫性学習を組み合わせた堅牢な検出器であるSoftER Teacherを紹介する。
厳密な実験により、SoftER Teacherは必要なベースラベルの10%しか使用せず、強力な教師付き検出器の新規性能を上回ることが示されている。
論文 参考訳(メタデータ) (2023-03-10T06:49:31Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - Temporal Action Detection with Multi-level Supervision [116.55596693897388]
本稿では,ラベル付きデータとラベルなしデータを組み合わせたSemi-supervised Action Detection (SSAD)タスクを紹介する。
半教師付き分類タスクから直接適応したSSADベースラインの異なるタイプのエラーを解析する。
我々は,弱いラベル付きデータをSSADに組み込んで,3段階の監視レベルを持つOmni-supervised Action Detection (OSAD)を提案する。
論文 参考訳(メタデータ) (2020-11-24T04:45:17Z) - Many-shot from Low-shot: Learning to Annotate using Mixed Supervision
for Object Detection [27.354492072251492]
オンラインアノテーションモジュール(OAM)は、弱いラベル付き画像の大きなボリュームから、多数の強調可能なアノテーションセットを生成することを学ぶ。
我々のOAMは、完全に教師された2段階のオブジェクト検出手法で共同で訓練することができ、オンザフライで追加のトレーニングアノテーションを提供する。
OAMとFast(er) R-CNNの統合により、PASCAL VOC 2007とMS-COCOベンチマークで17%$mAP、9%$AP50のパフォーマンスが向上し、混合監視による競合メソッドよりも大幅に向上した。
論文 参考訳(メタデータ) (2020-08-21T22:06:43Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。