論文の概要: Gen2Det: Generate to Detect
- arxiv url: http://arxiv.org/abs/2312.04566v1
- Date: Thu, 7 Dec 2023 18:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 13:24:14.594514
- Title: Gen2Det: Generate to Detect
- Title(参考訳): Gen2Det: 生成して検出する
- Authors: Saksham Suri, Fanyi Xiao, Animesh Sinha, Sean Chang Culatana,
Raghuraman Krishnamoorthi, Chenchen Zhu, Abhinav Shrivastava
- Abstract要約: Gen2Detは、オブジェクト検出のための合成トレーニングデータを無償で作成するためのシンプルなモジュールパイプラインです。
合成データに加えて、Gen2Detは画像レベルのフィルタリング、インスタンスレベルのフィルタリング、より良いトレーニングレシピなど、生成されたデータを最大限に活用するための一連のテクニックを提案している。
- 参考スコア(独自算出の注目度): 42.13657805295144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently diffusion models have shown improvement in synthetic image quality
as well as better control in generation. We motivate and present Gen2Det, a
simple modular pipeline to create synthetic training data for object detection
for free by leveraging state-of-the-art grounded image generation methods.
Unlike existing works which generate individual object instances, require
identifying foreground followed by pasting on other images, we simplify to
directly generating scene-centric images. In addition to the synthetic data,
Gen2Det also proposes a suite of techniques to best utilize the generated data,
including image-level filtering, instance-level filtering, and better training
recipe to account for imperfections in the generation. Using Gen2Det, we show
healthy improvements on object detection and segmentation tasks under various
settings and agnostic to detection methods. In the long-tailed detection
setting on LVIS, Gen2Det improves the performance on rare categories by a large
margin while also significantly improving the performance on other categories,
e.g. we see an improvement of 2.13 Box AP and 1.84 Mask AP over just training
on real data on LVIS with Mask R-CNN. In the low-data regime setting on COCO,
Gen2Det consistently improves both Box and Mask AP by 2.27 and 1.85 points. In
the most general detection setting, Gen2Det still demonstrates robust
performance gains, e.g. it improves the Box and Mask AP on COCO by 0.45 and
0.32 points.
- Abstract(参考訳): 近年の拡散モデルでは, 合成画像の品質が向上し, 生成時の制御性も向上している。
我々は,最先端の接地画像生成手法を活用し,オブジェクト検出のための合成トレーニングデータを無償で作成するための,シンプルなモジュラーパイプラインであるgen2detを動機付け,提示する。
個々のオブジェクトインスタンスを生成する既存の作品とは異なり、前景を識別し、他の画像に貼り付ける必要がある。
合成データに加えて、gen2det氏は、画像レベルのフィルタリング、インスタンスレベルのフィルタリング、生成の不完全性を考慮したトレーニングレシピの改善など、生成されたデータを活用するための一連のテクニックも提案している。
Gen2Detを用いることで、さまざまな設定下でのオブジェクト検出およびセグメンテーションタスクの健全な改善と検出方法の非依存性を示す。
lvisのロングテール検出設定では、gen2detはレアカテゴリのパフォーマンスを大きなマージンで改善すると同時に、マスクr-cnnによるlvisの実データでのトレーニングだけで2.13ボックスapと1.84マスクapが改善されるなど、他のカテゴリのパフォーマンスを著しく改善している。
COCOの低データ設定では、Gen2DetはBoxとMask APの両方を2.27ポイントと1.85ポイント改善している。
最も一般的な検出設定では、Gen2Detは依然として堅牢なパフォーマンス向上を示しており、例えばCOCO上のBoxとMask APを0.45と0.32ポイント改善している。
関連論文リスト
- AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation [38.89367726721828]
リモートセンシング画像オブジェクト検出(RSIOD)は、衛星や空中画像内の特定の物体を特定し、特定することを目的としている。
現在のRSIODデータセットにはラベル付きデータが不足しており、現在の検出アルゴリズムのパフォーマンスを著しく制限している。
本稿では,RSIODに適したレイアウト制御可能な拡散生成モデル(AeroGen)を提案する。
論文 参考訳(メタデータ) (2024-11-23T09:04:33Z) - GenView: Enhancing View Quality with Pretrained Generative Model for Self-Supervised Learning [90.13980177575809]
GenViewは、ポジティブなビューの多様性を強化するコントロール可能なフレームワークである。
我々は、正のペアの品質を評価する品質駆動のコントラスト損失を導入する。
肯定的なビュー品質の改善と品質主導のコントラスト損失のおかげで、GenViewはさまざまなタスクにわたる自己教師型学習を大幅に改善した。
論文 参考訳(メタデータ) (2024-03-18T17:41:26Z) - Active Generation for Image Classification [45.93535669217115]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - InstaGen: Enhancing Object Detection by Training on Synthetic Dataset [59.445498550159755]
本稿では,オブジェクト検出機能の向上,例えばカテゴリ拡大や検出性能の向上など,新たなパラダイムを提案する。
我々は、インスタンスレベルのグラウンドヘッドを事前訓練された生成拡散モデルに統合し、生成された画像のインスタンスをローカライズする機能で拡張する。
我々は、InstaGenと呼ばれる拡散モデルの強化版がデータシンセサイザーとして機能することを示すために、徹底的な実験を行う。
論文 参考訳(メタデータ) (2024-02-08T18:59:53Z) - Randomize to Generalize: Domain Randomization for Runway FOD Detection [1.4249472316161877]
細い物体検出は、小型化、低解像度化、オクルージョン化、背景クラッタ、照明条件、被写体対画像比の小さいため困難である。
本稿では,SRIA(Synthetic Image Augmentation)の新たな2段階手法を提案する。
検出精度は初期41%からOODテストセットの92%に改善した。
論文 参考訳(メタデータ) (2023-09-23T05:02:31Z) - GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data
Generation [91.01581867841894]
様々な幾何学的条件をテキストプロンプトに柔軟に翻訳できるシンプルなフレームワークであるGeoDiffusionを提案する。
われわれのGeoDiffusionは、バウンディングボックスだけでなく、自動運転シーンのカメラビューのような余分な幾何学的条件もエンコードできる。
論文 参考訳(メタデータ) (2023-06-07T17:17:58Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Towards Fine-grained Image Classification with Generative Adversarial
Networks and Facial Landmark Detection [0.0]
GANベースのデータ拡張を使用して、余分なデータセットインスタンスを生成します。
近年の視覚変換器 (ViT) モデルを用いて, きめ細かい画像分類の精度を評価し, 評価を行った。
論文 参考訳(メタデータ) (2021-08-28T06:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。