論文の概要: DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort
- arxiv url: http://arxiv.org/abs/2104.06490v1
- Date: Tue, 13 Apr 2021 20:08:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-15 13:21:05.270943
- Title: DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort
- Title(参考訳): datasetgan: 最小限の労力で効率的なラベル付きデータファクトリ
- Authors: Yuxuan Zhang, Huan Ling, Jun Gao, Kangxue Yin, Jean-Francois Lafleche,
Adela Barriuso, Antonio Torralba, Sanja Fidler
- Abstract要約: 現在のディープネットワークは、大規模なデータセットのトレーニングの恩恵を受ける、非常にデータハングリーです。
GAN潜入コードがどのようにデコードされ、イメージのセマンティックセグメンテーションを生成するかを示す。
これらの生成されたデータセットは、実際のデータセットと同じように、コンピュータビジョンアーキテクチャのトレーニングに使用できます。
- 参考スコア(独自算出の注目度): 117.41383937100751
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce DatasetGAN: an automatic procedure to generate massive datasets
of high-quality semantically segmented images requiring minimal human effort.
Current deep networks are extremely data-hungry, benefiting from training on
large-scale datasets, which are time consuming to annotate. Our method relies
on the power of recent GANs to generate realistic images. We show how the GAN
latent code can be decoded to produce a semantic segmentation of the image.
Training the decoder only needs a few labeled examples to generalize to the
rest of the latent space, resulting in an infinite annotated dataset generator!
These generated datasets can then be used for training any computer vision
architecture just as real datasets are. As only a few images need to be
manually segmented, it becomes possible to annotate images in extreme detail
and generate datasets with rich object and part segmentations. To showcase the
power of our approach, we generated datasets for 7 image segmentation tasks
which include pixel-level labels for 34 human face parts, and 32 car parts. Our
approach outperforms all semi-supervised baselines significantly and is on par
with fully supervised methods, which in some cases require as much as 100x more
annotated data as our method.
- Abstract(参考訳): 人間の努力を最小限に抑えた高品質なセマンティックな画像の大量のデータセットを生成するための自動処理であるDatasetGANを紹介する。
現在のディープネットワークは非常にデータ量が多く、注釈に時間を費やす大規模なデータセットでのトレーニングの恩恵を受けている。
本手法は,最近のganのパワーを利用して現実的な画像を生成する。
画像のセグメンテーションを生成するために、ganの潜在コードがどのようにデコードできるかを示す。
デコーダのトレーニングには、潜在空間の残りの部分に一般化するためにラベル付きの例がいくつか必要なだけである。
これらの生成されたデータセットは、実際のデータセットと同じように、コンピュータビジョンアーキテクチャのトレーニングに使用することができる。
手動でセグメンテーションする必要があるため、極端に詳細な画像に注釈を付け、リッチなオブジェクトと部分セグメンテーションでデータセットを生成することができる。
提案手法のパワーを示すために,34個の顔部品と32個の車部品の画素レベルラベルを含む7つの画像分割タスクのデータセットを生成した。
提案手法は,全半教師付きベースラインを著しく上回り,全教師付きメソッドと同等であり,100倍以上の注釈付きデータを必要とする場合もある。
関連論文リスト
- DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion
Models [61.906934570771256]
多様な合成画像や知覚アノテーションを生成できる汎用データセット生成モデルを提案する。
本手法は,事前学習した拡散モデルに基づいて,テキスト誘導画像合成を知覚データ生成に拡張する。
拡散モデルのリッチ潜時コードはデコーダモジュールを用いて正確な認識アノテーションとして効果的に復号できることを示す。
論文 参考訳(メタデータ) (2023-08-11T14:38:11Z) - NuInsSeg: A Fully Annotated Dataset for Nuclei Instance Segmentation in
H&E-Stained Histological Images [1.1500025852056222]
我々は、ヘマトキシリンとエオシン(H&E)を染色した組織像(NuInsSeg)で、手動で注釈付けされた最も大きな核のデータセットの1つを公表した。
このデータセットには、665枚の画像パッチが含まれており、31個のヒトとマウスの臓器から3万個以上の手動で分割されている。
データセット全体に対して、初めて、あいまいなエリアマスクを新たに提供します。
論文 参考訳(メタデータ) (2023-08-03T13:45:07Z) - HandsOff: Labeled Dataset Generation With No Additional Human
Annotations [13.11411442720668]
本稿では,任意の数の合成画像と対応するラベルを生成する技術であるHandsOffフレームワークを紹介する。
本フレームワークは,GANインバージョンフィールドとデータセット生成を統一することにより,先行作業の現実的な欠点を回避する。
顔、車、フルボディの人間のポーズ、都市運転シーンなど、複数の挑戦的な領域において、リッチなピクセルワイズラベルを持つデータセットを生成します。
論文 参考訳(メタデータ) (2022-12-24T03:37:02Z) - High-Quality Entity Segmentation [110.55724145851725]
CropFormerは高解像度画像におけるインスタンスレベルのセグメンテーションの難易度に対処するために設計されている。
よりきめ細かい画像とフルイメージを提供する高解像度の画像作物を融合することで、マスク予測を改善する。
CropFormerでは、難易度の高いエンティティセグメンテーションタスクで1.9ドルという大きなAP利益を達成しています。
論文 参考訳(メタデータ) (2022-11-10T18:58:22Z) - Scrape, Cut, Paste and Learn: Automated Dataset Generation Applied to
Parcel Logistics [58.720142291102135]
4つのステップでインスタンスセグメンテーションのための合成データセットを生成するために,完全に自動化されたパイプラインを提案する。
まず、人気のある画像検索エンジンから興味ある対象の画像を抽出する。
画像選択には,オブジェクトに依存しない事前処理,手動画像選択,CNNに基づく画像選択の3つの方法を比較する。
論文 参考訳(メタデータ) (2022-10-18T12:49:04Z) - BigDatasetGAN: Synthesizing ImageNet with Pixel-wise Annotations [89.42397034542189]
我々は,GAN(Generative Adversarial Network)を介して,大規模ラベル付きデータセットを合成する。
我々は、ImageNetで訓練されたクラス条件生成モデルBigGANの画像サンプルを、すべての1kクラスに対して、クラス毎の5つのイメージを手動でアノテートする。
我々は、追加の8k実画像のセットをラベル付けして、新しいImageNetベンチマークを作成し、様々な設定でセグメンテーション性能を評価する。
論文 参考訳(メタデータ) (2022-01-12T20:28:34Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。