論文の概要: From Prompts to Deployment: Auto-Curated Domain-Specific Dataset Generation via Diffusion Models
- arxiv url: http://arxiv.org/abs/2601.08095v1
- Date: Tue, 13 Jan 2026 00:29:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.98994
- Title: From Prompts to Deployment: Auto-Curated Domain-Specific Dataset Generation via Diffusion Models
- Title(参考訳): プロンプトからデプロイ:拡散モデルによる自動計算ドメイン特化データセット生成
- Authors: Dongsik Yoon, Jongeun Kim,
- Abstract要約: 我々のフレームワークは、まず、制御された塗り絵を通して、ドメイン固有の背景の中でターゲットオブジェクトを合成する。
生成された出力は、オブジェクト検出、美的スコアリング、視覚言語アライメントを統合するマルチモーダルアセスメントによって検証される。
このパイプラインは、高品質でデプロイ可能なデータセットの効率的な構築を可能にすると同時に、大規模な実世界のデータ収集への依存を低減します。
- 参考スコア(独自算出の注目度): 2.101267270902429
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present an automated pipeline for generating domain-specific synthetic datasets with diffusion models, addressing the distribution shift between pre-trained models and real-world deployment environments. Our three-stage framework first synthesizes target objects within domain-specific backgrounds through controlled inpainting. The generated outputs are then validated via a multi-modal assessment that integrates object detection, aesthetic scoring, and vision-language alignment. Finally, a user-preference classifier is employed to capture subjective selection criteria. This pipeline enables the efficient construction of high-quality, deployable datasets while reducing reliance on extensive real-world data collection.
- Abstract(参考訳): 本稿では,拡散モデルを用いたドメイン固有合成データセットの自動生成パイプラインを提案する。
私たちの3段階のフレームワークは、まず、制御された塗り絵を通して、ドメイン固有の背景内のターゲットオブジェクトを合成します。
生成された出力は、オブジェクト検出、美的スコアリング、視覚言語アライメントを統合するマルチモーダルアセスメントによって検証される。
最後に、主観的選択基準をキャプチャするために、ユーザ参照分類器を用いる。
このパイプラインは、高品質でデプロイ可能なデータセットの効率的な構築を可能にすると同時に、大規模な実世界のデータ収集への依存を低減します。
関連論文リスト
- Coarse-to-Fine Hierarchical Alignment for UAV-based Human Detection using Diffusion Models [14.696438400081114]
本稿では,UAVに基づく人体検出のための合成データを変換するための3段階拡散型フレームワークを提案する。
Cwdはグローバルなスタイルとローカルなコンテンツドメインの相違を明確に分離し、3つのモジュールを使ってそれらのギャップを埋める。
提案手法は,Semantic-DroneベンチマークでmAP50を最大14.1ドルで改善する。
論文 参考訳(メタデータ) (2025-12-15T19:57:36Z) - Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - Domain Specific Data Distillation and Multi-modal Embedding Generation [0.0]
ドメイン中心の埋め込みを作成するという課題は、非構造化データの豊富さとドメイン固有の構造化データの不足から生じる。
本稿では,非構造化データからノイズをフィルタリングするために構造化データを活用する新しいモデリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:47:46Z) - Imagining the Unseen: Generative Location Modeling for Object Placement [49.71690795831461]
対象物に対する可塑性境界ボックスの予測を学習する生成的位置モデルを開発する。
我々のアプローチはまずイメージとターゲットオブジェクトクラスをトークン化し、次に自動回帰変換器を通して境界ボックス座標をデコードする。
実験により,OPAデータセットの配置精度が向上することが確認された。
論文 参考訳(メタデータ) (2024-10-17T14:00:41Z) - Semi-supervised Domain Adaptation via Prototype-based Multi-level
Learning [4.232614032390374]
半教師付きドメイン適応(SSDA)では、各クラスのいくつかのラベル付きターゲットサンプルが、完全なラベル付きソースドメインからターゲットドメインへの知識表現の転送を支援する。
本稿では,ラベル付き対象サンプルの可能性をうまく活用するために,プロトタイプベースのマルチレベル学習(ProML)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T10:09:30Z) - HaDR: Applying Domain Randomization for Generating Synthetic Multimodal
Dataset for Hand Instance Segmentation in Cluttered Industrial Environments [0.0]
本研究では、ドメインランダム化を用いて、マルチモーダルインスタンスセグメンテーションモデルのトレーニングのための合成RGB-Dデータセットを生成する。
提案手法により,既存の最先端データセットでトレーニングしたモデルよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-04-12T13:02:08Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Synthetic-to-Real Domain Generalized Semantic Segmentation for 3D Indoor
Point Clouds [69.64240235315864]
本稿では,本課題に対して,合成-実領域一般化設定を提案する。
合成と実世界のポイントクラウドデータのドメインギャップは、主に異なるレイアウトとポイントパターンにあります。
CINMixとMulti-prototypeの両方が分配ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2022-12-09T05:07:43Z) - Multiple-Source Domain Adaptation via Coordinated Domain Encoders and
Paired Classifiers [1.52292571922932]
ドメインシフトの下でのテキスト分類の新しいモデルを提案する。
更新表現を利用して、ドメインエンコーダを動的に統合する。
また、ターゲットドメインのエラー率を推測するために確率モデルも採用している。
論文 参考訳(メタデータ) (2022-01-28T00:50:01Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。