論文の概要: DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection
- arxiv url: http://arxiv.org/abs/2309.03893v1
- Date: Thu, 7 Sep 2023 17:55:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-08 11:47:15.493685
- Title: DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection
- Title(参考訳): DiffusionEngine: Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジン
- Authors: Manlin Zhang, Jie Wu, Yuxi Ren, Ming Li, Jie Qin, Xuefeng Xiao, Wei
Liu, Rui Wang, Min Zheng, Andy J. Ma
- Abstract要約: Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
- 参考スコア(独自算出の注目度): 41.436817746749384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data is the cornerstone of deep learning. This paper reveals that the
recently developed Diffusion Model is a scalable data engine for object
detection. Existing methods for scaling up detection-oriented data often
require manual collection or generative models to obtain target images,
followed by data augmentation and labeling to produce training pairs, which are
costly, complex, or lacking diversity. To address these issues, we
presentDiffusionEngine (DE), a data scaling-up engine that provides
high-quality detection-oriented training pairs in a single stage. DE consists
of a pre-trained diffusion model and an effective Detection-Adapter,
contributing to generating scalable, diverse and generalizable detection data
in a plug-and-play manner. Detection-Adapter is learned to align the implicit
semantic and location knowledge in off-the-shelf diffusion models with
detection-aware signals to make better bounding-box predictions. Additionally,
we contribute two datasets, i.e., COCO-DE and VOC-DE, to scale up existing
detection benchmarks for facilitating follow-up research. Extensive experiments
demonstrate that data scaling-up via DE can achieve significant improvements in
diverse scenarios, such as various detection algorithms, self-supervised
pre-training, data-sparse, label-scarce, cross-domain, and semi-supervised
learning. For example, when using DE with a DINO-based adapter to scale up
data, mAP is improved by 3.1% on COCO, 7.6% on VOC, and 11.5% on Clipart.
- Abstract(参考訳): 深層学習の基盤はデータだ。
本稿では,最近開発された拡散モデルが,オブジェクト検出のためのスケーラブルなデータエンジンであることを示す。
既存の検出指向データのスケールアップ方法は、しばしば、目標画像を得るために手動の収集または生成モデルを必要とし、続いてデータ拡張とラベル付けによって、コストが高く、複雑で、多様性に欠けるトレーニングペアを生成する。
これらの問題に対処するために,我々は,高品質な検出指向のトレーニングペアを単一ステージで提供するデータスケーリングエンジンであるdiffusionengine(de)を提案する。
deは、事前学習された拡散モデルと効果的な検出適応モデルで構成され、プラグ・アンド・プレイ方式でスケーラブルで多様で一般化可能な検出データを生成するのに寄与する。
Detection-Adapterは、オフザシェルフ拡散モデルにおける暗黙的な意味と位置の知識を検出認識信号と整合させて、バウンディングボックス予測を改善する。
さらに,COCO-DEとVOC-DEという2つのデータセットをコントリビュートして,既存の検出ベンチマークをスケールアップし,追跡調査を容易にする。
大規模な実験により、DEによるデータのスケールアップは、さまざまな検出アルゴリズム、自己教師付き事前トレーニング、データスパース、ラベルスカース、クロスドメイン、半教師付き学習など、さまざまなシナリオで大幅に改善できることが示された。
例えば、DINOベースのアダプタを使ってデータをスケールアップする場合、mAPはCOCOで3.1%、VOCで7.6%、Clipartで11.5%改善される。
関連論文リスト
- DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - DTAAD: Dual Tcn-Attention Networks for Anomaly Detection in Multivariate Time Series Data [0.0]
本稿では,Transformer と Dual Temporal Convolutional Network (TCN) に基づく異常検出・診断モデル DTAAD を提案する。
予測精度の向上と相関性の向上のために,スケーリング手法とフィードバック機構を導入している。
7つの公開データセットに対する実験により、DTAADは検出および診断性能の両面で現在最先端のベースライン法の大部分を超えていることが確認された。
論文 参考訳(メタデータ) (2023-02-17T06:59:45Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。