論文の概要: Unsupervised data augmentation for object detection
- arxiv url: http://arxiv.org/abs/2104.14965v1
- Date: Fri, 30 Apr 2021 13:02:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 16:55:56.966786
- Title: Unsupervised data augmentation for object detection
- Title(参考訳): オブジェクト検出のための教師なしデータ拡張
- Authors: Yichen Zhang, Zeyang Song, Wenbo Li
- Abstract要約: 本稿では,GAN(Generative Adversarial Networks)を用いて,教師なしデータ拡張を行うフレームワークを提案する。
YOLOv4の最近の最高性能に基づいて,物体が一定の位置にある画像を生成する2段階のパイプラインを提案する。
- 参考スコア(独自算出の注目度): 13.465808931940595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data augmentation has always been an effective way to overcome overfitting
issue when the dataset is small. There are already lots of augmentation
operations such as horizontal flip, random crop or even Mixup. However, unlike
image classification task, we cannot simply perform these operations for object
detection task because of the lack of labeled bounding boxes information for
corresponding generated images. To address this challenge, we propose a
framework making use of Generative Adversarial Networks(GAN) to perform
unsupervised data augmentation. To be specific, based on the recently supreme
performance of YOLOv4, we propose a two-step pipeline that enables us to
generate an image where the object lies in a certain position. In this way, we
can accomplish the goal that generating an image with bounding box label.
- Abstract(参考訳): データ拡張は、データセットが小さい場合、オーバーフィッティング問題を克服するための効果的な方法でした。
水平フリップ、ランダム作物、あるいはミックスアップなど、すでに多くの拡張操作がある。
しかし、画像分類タスクとは異なり、対応する画像に対してラベル付きバウンディングボックス情報がないため、オブジェクト検出タスクではこれらの操作を単純に行えない。
この課題に対処するために,GAN(Generative Adversarial Networks)を用いて教師なしデータ拡張を行うフレームワークを提案する。
具体的には、最近発表されたyolov4の最高性能に基づいて、オブジェクトが特定の位置にあるイメージを生成する2段階のパイプラインを提案する。
このようにして、バウンディングボックスラベルで画像を生成するという目標を達成できます。
関連論文リスト
- Knowledge Combination to Learn Rotated Detection Without Rotated
Annotation [53.439096583978504]
回転バウンディングボックスは、伸長したオブジェクトの出力あいまいさを劇的に減少させる。
この効果にもかかわらず、回転検出器は広く使われていない。
本稿では,モデルが正確な回転ボックスを予測できるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-05T03:07:36Z) - High-Quality Entity Segmentation [110.55724145851725]
CropFormerは高解像度画像におけるインスタンスレベルのセグメンテーションの難易度に対処するために設計されている。
よりきめ細かい画像とフルイメージを提供する高解像度の画像作物を融合することで、マスク予測を改善する。
CropFormerでは、難易度の高いエンティティセグメンテーションタスクで1.9ドルという大きなAP利益を達成しています。
論文 参考訳(メタデータ) (2022-11-10T18:58:22Z) - BigDatasetGAN: Synthesizing ImageNet with Pixel-wise Annotations [89.42397034542189]
我々は,GAN(Generative Adversarial Network)を介して,大規模ラベル付きデータセットを合成する。
我々は、ImageNetで訓練されたクラス条件生成モデルBigGANの画像サンプルを、すべての1kクラスに対して、クラス毎の5つのイメージを手動でアノテートする。
我々は、追加の8k実画像のセットをラベル付けして、新しいImageNetベンチマークを作成し、様々な設定でセグメンテーション性能を評価する。
論文 参考訳(メタデータ) (2022-01-12T20:28:34Z) - Bridging the Gap between Events and Frames through Unsupervised Domain
Adaptation [57.22705137545853]
本稿では,ラベル付き画像とラベル付きイベントデータを用いてモデルを直接訓練するタスク転送手法を提案する。
生成イベントモデルを利用して、イベント機能をコンテンツとモーションに分割します。
われわれのアプローチは、イベントベースのニューラルネットワークのトレーニングのために、膨大な量の既存の画像データセットをアンロックする。
論文 参考訳(メタデータ) (2021-09-06T17:31:37Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Six-channel Image Representation for Cross-domain Object Detection [17.854940064699985]
ディープラーニングモデルはデータ駆動であり、優れたパフォーマンスは豊富で多様なデータセットに依存する。
いくつかの画像から画像への翻訳技術は、モデルを訓練するために特定のシーンの偽データを生成するために用いられる。
3チャンネル画像とそのgan生成した偽画像に刺激を与え,データセットの6チャンネル表現を作成することを提案する。
論文 参考訳(メタデータ) (2021-01-03T04:50:03Z) - Object Segmentation Without Labels with Large-Scale Generative Models [43.679717400251924]
教師なしおよび自己教師付き学習の最近の増加は、ラベル付きデータへの依存を劇的に減らした。
大規模な教師なしモデルは、ピクセルレベルも画像レベルのラベル付けも必要とせず、より困難なオブジェクトセグメンテーションタスクを実行することもできる。
近年の非教師付きGANでは,前景/背景画素の区別が可能で,高品質なサリエンシマスクが実現されている。
論文 参考訳(メタデータ) (2020-06-08T23:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。