論文の概要: Semi-Weakly Supervised Object Detection by Sampling Pseudo Ground-Truth
Boxes
- arxiv url: http://arxiv.org/abs/2204.00147v1
- Date: Fri, 1 Apr 2022 00:44:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 00:22:42.257734
- Title: Semi-Weakly Supervised Object Detection by Sampling Pseudo Ground-Truth
Boxes
- Title(参考訳): Pseudo Ground-Truth Box サンプリングによる半弱監視対象検出
- Authors: Akhil Meethal, Marco Pedersoli, Zhongwen Zhu, Francisco Perdigon
Romero, and Eric Granger
- Abstract要約: 本稿では,オブジェクト検出のための弱い半教師付きトレーニング手法を提案する。
弱ラベル画像の情報とともに、少数の完全ラベル画像のみを活用することにより、最先端のパフォーマンスを実現する。
特に,我々の一般的なサンプリングベース学習戦略は,オンライン方式で擬似接地構文(GT)境界アノテーションを生成する。
- 参考スコア(独自算出の注目度): 9.827002225566073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi- and weakly-supervised learning have recently attracted considerable
attention in the object detection literature since they can alleviate the cost
of annotation needed to successfully train deep learning models. State-of-art
approaches for semi-supervised learning rely on student-teacher models trained
using a multi-stage process, and considerable data augmentation. Custom
networks have been developed for the weakly-supervised setting, making it
difficult to adapt to different detectors. In this paper, a weakly
semi-supervised training method is introduced that reduces these training
challenges, yet achieves state-of-the-art performance by leveraging only a
small fraction of fully-labeled images with information in weakly-labeled
images. In particular, our generic sampling-based learning strategy produces
pseudo-ground-truth (GT) bounding box annotations in an online fashion,
eliminating the need for multi-stage training, and student-teacher network
configurations. These pseudo GT boxes are sampled from weakly-labeled images
based on the categorical score of object proposals accumulated via a score
propagation process. Empirical results on the Pascal VOC dataset, indicate that
the proposed approach improves performance by 5.0% when using VOC 2007 as
fully-labeled, and VOC 2012 as weak-labeled data. Also, with 5-10% fully
annotated images, we observed an improvement of more than 10% in mAP, showing
that a modest investment in image-level annotation, can substantially improve
detection performance.
- Abstract(参考訳): 半教師付き学習と弱い教師付き学習は、ディープラーニングモデルのトレーニングに要するアノテーションのコストを軽減できるため、最近オブジェクト検出文献においてかなりの注目を集めている。
半教師付き学習に対する最先端のアプローチは、多段階のプロセスで訓練された学生-教師モデルとかなりのデータ拡張に依存している。
弱い制御された設定のためにカスタムネットワークが開発されており、異なる検出器に適応することが困難である。
本稿では,これらの学習課題を低減しつつも,弱ラベル画像の情報を有する完全ラベル画像のごく一部を活用し,最先端の性能を実現するための弱教師付き訓練手法を提案する。
特に,本研究の総合的なサンプリングベース学習戦略は,多段階学習や学生-教師ネットワーク構成の必要性を排除し,オンライン方式で擬似接地構文(GT)境界アノテーションを生成する。
これらの擬似GTボックスは、スコア伝搬プロセスを介して蓄積されたオブジェクト提案のカテゴリスコアに基づいて、弱いラベル付き画像からサンプリングされる。
Pascal VOCデータセットの実証的な結果から、VOC 2007を完全ラベルデータ、VOC 2012を弱いラベルデータとして使用する場合、提案手法によりパフォーマンスが5.0%向上することが示された。
また,5~10%の注釈付き画像では,mAPの10%以上の改善が見られ,画像レベルのアノテーションへのわずかな投資により検出性能が大幅に向上することが示された。
関連論文リスト
- Robust Noisy Label Learning via Two-Stream Sample Distillation [48.73316242851264]
ノイズラベル学習は、ノイズラベルの監督の下で堅牢なネットワークを学習することを目的としている。
我々はTSSD(Two-Stream Sample Distillation)と呼ばれるシンプルで効果的なサンプル選択フレームワークを設計する。
このフレームワークは、ネットワークトレーニングの堅牢性を改善するために、クリーンなラベルでより高品質なサンプルを抽出することができる。
論文 参考訳(メタデータ) (2024-04-16T12:18:08Z) - Semi-Supervised Learning for hyperspectral images by non parametrically
predicting view assignment [25.198550162904713]
ハイパースペクトル画像(HSI)分類は、画像中のスペクトル情報が高いため、現在、多くの勢いを増している。
近年,ラベル付きサンプルを最小限に抑えたディープラーニングモデルを効果的に訓練するために,ラベル付きサンプルも自己教師付きおよび半教師付き設定で活用されている。
本研究では,半教師付き学習の概念を利用して,モデルの識別的自己教師型事前学習を支援する。
論文 参考訳(メタデータ) (2023-06-19T14:13:56Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - STEdge: Self-training Edge Detection with Multi-layer Teaching and
Regularization [15.579360385857129]
大規模未ラベル画像データセットの未使用富を活用した自己学習エッジ検出の課題について検討する。
マルチレイヤの正規化と自己学習を併用した自己教師型フレームワークを設計する。
本手法は,未確認のBIPEDデータセットを用いて,ODSが4.8%,OISが5.8%向上した。
論文 参考訳(メタデータ) (2022-01-13T18:26:36Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - Empirical Perspectives on One-Shot Semi-supervised Learning [0.0]
新しいアプリケーションにディープニューラルネットワークを採用する際の最大の障害の1つは、ネットワークのトレーニングが通常、多数の手作業によるトレーニングサンプルを必要とすることである。
ディープネットワークをトレーニングするためには、大量のラベル付きデータにアクセスするが、クラス毎に1つのサンプルのみをラベル付けする必要があるシナリオを実証的に検討する。
論文 参考訳(メタデータ) (2020-04-08T17:51:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。