論文の概要: Gen2Det: Generate to Detect
- arxiv url: http://arxiv.org/abs/2312.04566v1
- Date: Thu, 7 Dec 2023 18:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 13:24:14.594514
- Title: Gen2Det: Generate to Detect
- Title(参考訳): Gen2Det: 生成して検出する
- Authors: Saksham Suri, Fanyi Xiao, Animesh Sinha, Sean Chang Culatana,
Raghuraman Krishnamoorthi, Chenchen Zhu, Abhinav Shrivastava
- Abstract要約: Gen2Detは、オブジェクト検出のための合成トレーニングデータを無償で作成するためのシンプルなモジュールパイプラインです。
合成データに加えて、Gen2Detは画像レベルのフィルタリング、インスタンスレベルのフィルタリング、より良いトレーニングレシピなど、生成されたデータを最大限に活用するための一連のテクニックを提案している。
- 参考スコア(独自算出の注目度): 42.13657805295144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently diffusion models have shown improvement in synthetic image quality
as well as better control in generation. We motivate and present Gen2Det, a
simple modular pipeline to create synthetic training data for object detection
for free by leveraging state-of-the-art grounded image generation methods.
Unlike existing works which generate individual object instances, require
identifying foreground followed by pasting on other images, we simplify to
directly generating scene-centric images. In addition to the synthetic data,
Gen2Det also proposes a suite of techniques to best utilize the generated data,
including image-level filtering, instance-level filtering, and better training
recipe to account for imperfections in the generation. Using Gen2Det, we show
healthy improvements on object detection and segmentation tasks under various
settings and agnostic to detection methods. In the long-tailed detection
setting on LVIS, Gen2Det improves the performance on rare categories by a large
margin while also significantly improving the performance on other categories,
e.g. we see an improvement of 2.13 Box AP and 1.84 Mask AP over just training
on real data on LVIS with Mask R-CNN. In the low-data regime setting on COCO,
Gen2Det consistently improves both Box and Mask AP by 2.27 and 1.85 points. In
the most general detection setting, Gen2Det still demonstrates robust
performance gains, e.g. it improves the Box and Mask AP on COCO by 0.45 and
0.32 points.
- Abstract(参考訳): 近年の拡散モデルでは, 合成画像の品質が向上し, 生成時の制御性も向上している。
我々は,最先端の接地画像生成手法を活用し,オブジェクト検出のための合成トレーニングデータを無償で作成するための,シンプルなモジュラーパイプラインであるgen2detを動機付け,提示する。
個々のオブジェクトインスタンスを生成する既存の作品とは異なり、前景を識別し、他の画像に貼り付ける必要がある。
合成データに加えて、gen2det氏は、画像レベルのフィルタリング、インスタンスレベルのフィルタリング、生成の不完全性を考慮したトレーニングレシピの改善など、生成されたデータを活用するための一連のテクニックも提案している。
Gen2Detを用いることで、さまざまな設定下でのオブジェクト検出およびセグメンテーションタスクの健全な改善と検出方法の非依存性を示す。
lvisのロングテール検出設定では、gen2detはレアカテゴリのパフォーマンスを大きなマージンで改善すると同時に、マスクr-cnnによるlvisの実データでのトレーニングだけで2.13ボックスapと1.84マスクapが改善されるなど、他のカテゴリのパフォーマンスを著しく改善している。
COCOの低データ設定では、Gen2DetはBoxとMask APの両方を2.27ポイントと1.85ポイント改善している。
最も一般的な検出設定では、Gen2Detは依然として堅牢なパフォーマンス向上を示しており、例えばCOCO上のBoxとMask APを0.45と0.32ポイント改善している。
関連論文リスト
- Active Generation for Image Classification [50.18107721267218]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Randomize to Generalize: Domain Randomization for Runway FOD Detection [1.4249472316161877]
細い物体検出は、小型化、低解像度化、オクルージョン化、背景クラッタ、照明条件、被写体対画像比の小さいため困難である。
本稿では,SRIA(Synthetic Image Augmentation)の新たな2段階手法を提案する。
検出精度は初期41%からOODテストセットの92%に改善した。
論文 参考訳(メタデータ) (2023-09-23T05:02:31Z) - GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data
Generation [91.01581867841894]
様々な幾何学的条件をテキストプロンプトに柔軟に翻訳できるシンプルなフレームワークであるGeoDiffusionを提案する。
われわれのGeoDiffusionは、バウンディングボックスだけでなく、自動運転シーンのカメラビューのような余分な幾何学的条件もエンコードできる。
論文 参考訳(メタデータ) (2023-06-07T17:17:58Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Adaptive Sparse Convolutional Networks with Global Context Enhancement
for Faster Object Detection on Drone Images [26.51970603200391]
本稿では,スパース畳み込みに基づく検出ヘッドの最適化について検討する。
これは、小さなオブジェクトのコンテキスト情報の不十分な統合に悩まされる。
本稿では,グローバルな文脈拡張型適応スパース畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T14:42:50Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Towards Fine-grained Image Classification with Generative Adversarial
Networks and Facial Landmark Detection [0.0]
GANベースのデータ拡張を使用して、余分なデータセットインスタンスを生成します。
近年の視覚変換器 (ViT) モデルを用いて, きめ細かい画像分類の精度を評価し, 評価を行った。
論文 参考訳(メタデータ) (2021-08-28T06:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。