論文の概要: DTGen: Generative Diffusion-Based Few-Shot Data Augmentation for Fine-Grained Dirty Tableware Recognition
- arxiv url: http://arxiv.org/abs/2509.11661v1
- Date: Mon, 15 Sep 2025 07:59:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.187219
- Title: DTGen: Generative Diffusion-Based Few-Shot Data Augmentation for Fine-Grained Dirty Tableware Recognition
- Title(参考訳): DTGen:Few-Shot Data Augmentation for Fine-Grained Dirty Tableware Recognition
- Authors: Lifei Hao, Yue Cheng, Baoqi Huang, Bing Jia, Xuandong Zhao,
- Abstract要約: 汚いテーブルウェア認識のための数ショットデータ拡張方式DTGenを提案する。
非常に限られた実数ショット条件下では、DTGenは事実上無制限に高品質なサンプルを合成することができる。
DTGenは、自動テーブルウェアクリーニングと食品安全監視のための実行可能なデプロイメントパスを提供する。
- 参考スコア(独自算出の注目度): 37.947945188644624
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent tableware cleaning is a critical application in food safety and smart homes, but existing methods are limited by coarse-grained classification and scarcity of few-shot data, making it difficult to meet industrialization requirements. We propose DTGen, a few-shot data augmentation scheme based on generative diffusion models, specifically designed for fine-grained dirty tableware recognition. DTGen achieves efficient domain specialization through LoRA, generates diverse dirty images via structured prompts, and ensures data quality through CLIP-based cross-modal filtering. Under extremely limited real few-shot conditions, DTGen can synthesize virtually unlimited high-quality samples, significantly improving classifier performance and supporting fine-grained dirty tableware recognition. We further elaborate on lightweight deployment strategies, promising to transfer DTGen's benefits to embedded dishwashers and integrate with cleaning programs to intelligently regulate energy consumption and detergent usage. Research results demonstrate that DTGen not only validates the value of generative AI in few-shot industrial vision but also provides a feasible deployment path for automated tableware cleaning and food safety monitoring.
- Abstract(参考訳): インテリジェントなテーブルウェアのクリーニングは、食品の安全性とスマートホームにおいて重要な応用であるが、既存の手法は、粗い分類と数ショットデータの不足によって制限されており、工業化の要件を満たすことは困難である。
生成拡散モデルに基づく数ショットデータ拡張方式DTGenを提案する。
DTGenは、LoRAによる効率的なドメイン特殊化、構造化プロンプトによる多様な汚い画像の生成、CLIPベースのクロスモーダルフィルタリングによるデータ品質の確保を実現している。
非常に限られた実数ショット条件下では、DTGenは事実上無制限に高品質なサンプルを合成でき、分類器の性能を大幅に改善し、きめ細かいテーブルウェア認識をサポートする。
DTGenの利点を組み込み食器洗い機に移管し、エネルギー消費と洗剤使用をインテリジェントに規制するクリーニングプログラムと統合することを約束する。
研究結果は、DTGenは、数ショットの産業ビジョンにおいて生成AIの価値を検証するだけでなく、自動テーブルウェアクリーニングと食品安全監視のための実現可能なデプロイメントパスも提供することを実証している。
関連論文リスト
- Artificial Intelligence in the Food Industry: Food Waste Estimation based on Computer Vision, a Brief Case Study in a University Dining Hall [1.864621482724548]
本研究は,プレートレベルの食品廃棄物を推定する費用対効果のコンピュータビジョンフレームワークを提案する。
4つの完全に教師されたモデルが、キャップ付き動的逆周波数損失とAdamWメトリクスを使用して訓練された。
全てのモデルが満足な性能を達成し、食品の種類ごとに、少なくとも1つのモデルがDPAに近づいたか、90%を超えた。
論文 参考訳(メタデータ) (2025-07-19T15:21:29Z) - Restoration Score Distillation: From Corrupted Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
Score Distillation (DSD) の原理的一般化である textitRestoration Score Distillation (RSD) を提案する。
RSDは、ぼやけた画像、不完全画像、低解像度画像など、広範囲の汚職タイプに対応している。
自然と科学の両方のデータセットの様々な復元作業において、教師モデルを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-19T17:21:03Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
低品質データから高品質な生成モデルをトレーニングするための驚くほど効果的で斬新なアプローチであるDSD(Denoising score distillation)を導入する。
DSDはノイズの多い劣化したサンプルにのみ拡散モデルを事前訓練し、精製されたクリーンな出力を生成することができる1ステップの発電機に蒸留する。
論文 参考訳(メタデータ) (2025-03-10T17:44:46Z) - WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.775894876221921]
ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文 参考訳(メタデータ) (2024-09-25T15:04:21Z) - Enhanced Droplet Analysis Using Generative Adversarial Networks [0.0]
この研究は、DropletGANという画像生成装置を開発し、ドロップレットの画像を生成する。
また、合成データセットを用いた光液滴検出器の開発にも用いられている。
我々の知る限りでは、この研究は初めて、液滴の検出を増強するための生成モデルを用いたものである。
論文 参考訳(メタデータ) (2024-02-24T21:20:53Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。