Fugu-MT 論文翻訳(概要): Ali-AUG: Innovative Approaches to Labeled Data Augmentation using One-Step Diffusion Model

論文の概要: Ali-AUG: Innovative Approaches to Labeled Data Augmentation using One-Step Diffusion Model

arxiv url: http://arxiv.org/abs/2410.18678v1
Date: Thu, 24 Oct 2024 12:12:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:39.897836
Title: Ali-AUG: Innovative Approaches to Labeled Data Augmentation using One-Step Diffusion Model
Title（参考訳）: Ali-AUG: 1ステップ拡散モデルを用いたラベル付きデータ拡張への革新的アプローチ
Authors: Ali Hamza, Aizea Lojo, Adrian Núñez-Marcos, Aitziber Atutxa,
Abstract要約: Ali-AUGは、産業応用における効率的なラベル付きデータ拡張のための新しい単一ステップ拡散モデルである。提案手法は, 正確な特徴挿入を伴う合成ラベル付き画像を生成することで, 限られたラベル付きデータの課題に対処する。
参考スコア（独自算出の注目度）: 0.14999444543328289
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper introduces Ali-AUG, a novel single-step diffusion model for efficient labeled data augmentation in industrial applications. Our method addresses the challenge of limited labeled data by generating synthetic, labeled images with precise feature insertion. Ali-AUG utilizes a stable diffusion architecture enhanced with skip connections and LoRA modules to efficiently integrate masks and images, ensuring accurate feature placement without affecting unrelated image content. Experimental validation across various industrial datasets demonstrates Ali-AUG's superiority in generating high-quality, defect-enhanced images while maintaining rapid single-step inference. By offering precise control over feature insertion and minimizing required training steps, our technique significantly enhances data augmentation capabilities, providing a powerful tool for improving the performance of deep learning models in scenarios with limited labeled data. Ali-AUG is especially useful for use cases like defective product image generation to train AI-based models to improve their ability to detect defects in manufacturing processes. Using different data preparation strategies, including Classification Accuracy Score (CAS) and Naive Augmentation Score (NAS), we show that Ali-AUG improves model performance by 31% compared to other augmentation methods and by 45% compared to models without data augmentation. Notably, Ali-AUG reduces training time by 32% and supports both paired and unpaired datasets, enhancing flexibility in data preparation.
Abstract（参考訳）: 本稿では,Ali-AUGについて紹介する。Ali-AUGは,産業応用における効率的なラベル付きデータ拡張のための新しい単一ステップ拡散モデルである。提案手法は, 正確な特徴挿入を伴う合成ラベル付き画像を生成することで, 限られたラベル付きデータの課題に対処する。 Ali-AUGは、スキップ接続とLoRAモジュールによって強化された安定した拡散アーキテクチャを使用して、マスクとイメージを効率的に統合し、無関係な画像コンテンツに影響を与えることなく正確な特徴配置を保証する。各種産業データセットに対する実験的検証は、高速な単一ステップ推論を維持しながら高品質な欠陥強調画像の生成におけるAli-AUGの優位性を証明している。特徴挿入を正確に制御し,必要なトレーニング手順を最小化することにより,データ拡張能力を大幅に向上し,ラベル付きデータに制限のあるシナリオにおけるディープラーニングモデルの性能向上のための強力なツールを提供する。 Ali-AUGは、AIベースのモデルをトレーニングし、製造プロセスの欠陥を検出する能力を向上する欠陥製品生成のようなユースケースで特に有用である。分類精度スコア(CAS)やNaive Augmentation Score(NAS)などの異なるデータ準備戦略を用いて、Ali-AUGは、他の拡張方法と比較して31%改善し、データ拡張のないモデルに比べて45%改善したことを示す。特に、Ali-AUGはトレーニング時間を32%削減し、ペアとアンペアの両方のデータセットをサポートし、データ準備の柔軟性を向上させる。

関連論文リスト

Ultra-Resolution Adaptation with Ease [62.56434979517156]
我々は,EmphURAEと呼ばれる超高分解能適応のための重要なガイドラインのセットを提案する。重み行列の小さな成分のチューニングは、合成データが利用できない場合に広く使用される低ランクアダプタよりも優れていることを示す。 URAEは、FLUX1.1[Pro] Ultraのような最先端のクローズドソースモデルに匹敵する2K世代の性能を達成している。
論文参考訳（メタデータ） (2025-03-20T16:44:43Z)
Acc3D: Accelerating Single Image to 3D Diffusion Models via Edge Consistency Guided Score Distillation [49.202383675543466]
本稿では,単一画像から3次元モデルを生成する拡散過程の高速化に取り組むために,Acc3Dを提案する。数段階の推論によって高品質な再構成を導出するため,ランダムノイズ状態におけるスコア関数の学習を規則化する上で重要な課題を強調した。
論文参考訳（メタデータ） (2025-03-20T09:18:10Z)
SGIA: Enhancing Fine-Grained Visual Classification with Sequence Generative Image Augmentation [16.642582574494742]
本稿では,FGVCデータセットを付加するためのSGIA(Sequence Generative Image Augmentation)を提案する。本手法は,実データと合成データとの領域ギャップを最小限に抑えるために,独自のブリッジング・トランスファー・ラーニング・プロセスを備えている。我々の研究は、CUB-200-2011データセットに対して、新しいベンチマークを設定し、従来の最先端モデルの分類精度を0.5%向上させる。
論文参考訳（メタデータ） (2024-12-09T01:39:46Z)
A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文参考訳（メタデータ） (2024-08-01T07:40:00Z)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳（メタデータ） (2024-03-20T04:58:03Z)
Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation [59.184980778643464]
ファインチューニング拡散モデル : 生成人工知能(GenAI)の最前線本稿では,拡散モデル(SPIN-Diffusion)のための自己演奏ファインチューニングという革新的な手法を紹介する。提案手法は従来の教師付き微調整とRL戦略の代替として,モデル性能とアライメントの両方を大幅に改善する。
論文参考訳（メタデータ） (2024-02-15T18:59:18Z)
DiffsFormer: A Diffusion Transformer on Stock Factor Augmentation [36.75453713794983]
トランスフォーマーアーキテクチャを用いたストックファクタ生成のための拡散モデル(DiffsFormer)を提案する。特定の下流タスクを提示すると、既存のサンプルを編集してトレーニング手順を強化するためにDiffsFormerを使用します。提案手法は,各データセットの年次リターン率の7.2%と27.8%を相対的に改善する。
論文参考訳（メタデータ） (2024-02-05T03:54:36Z)
VeCAF: Vision-language Collaborative Active Finetuning with Training Objective Awareness [56.87603097348203]
VeCAFはラベルと自然言語アノテーションを使用して、PVMの微調整のためのパラメトリックデータ選択を行う。 VeCAFは微調整の目的を取り入れて重要なデータポイントを選択し、PVMをより高速な収束に向けて効果的に導く。 ImageNetでは、VeCAFは最大3.3倍のトレーニングバッチを使用して、完全な微調整に比べて目標のパフォーマンスに到達する。
論文参考訳（メタデータ） (2024-01-15T17:28:37Z)
DualAug: Exploiting Additional Heavy Augmentation with OOD Data Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文参考訳（メタデータ） (2023-10-12T08:55:10Z)
Training on Thin Air: Improve Image Classification with Generated Data [28.96941414724037]
Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文参考訳（メタデータ） (2023-05-24T16:33:02Z)
Phased Data Augmentation for Training a Likelihood-Based Generative Model with Limited Data [0.0]
生成モデルは現実的なイメージの作成に優れていますが、トレーニングのための広範なデータセットに依存しているため、大きな課題があります。現在のデータ効率の手法はGANアーキテクチャに重点を置いており、他の生成モデルの訓練にギャップを残している。位相データ拡張(phased data augmentation)は、このギャップに対処する新しい手法であり、データ分散に固有の変更を加えることなく、限られたデータシナリオでのトレーニングを最適化する。
論文参考訳（メタデータ） (2023-05-22T03:38:59Z)
LA3: Efficient Label-Aware AutoAugment [23.705059658590436]
本稿では,ラベル情報を利用した新しい2段階データ拡張アルゴリズムであるラベル認識自動拡張(LA3)を提案する。 LA3は2つの学習段階から構成されており、第1段階ではラベルごとに個別の拡張手法を評価してランク付けする。第2段階では、有効性の選択と相補的な増強から複合増強ポリシーを構築し、性能を著しく向上させる。
論文参考訳（メタデータ） (2023-04-20T13:42:18Z)
Learning Representational Invariances for Data-Efficient Action Recognition [52.23716087656834]
我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
論文参考訳（メタデータ） (2021-03-30T17:59:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。