論文の概要: Diffusion-Based Data Augmentation for Image Recognition: A Systematic Analysis and Evaluation
- arxiv url: http://arxiv.org/abs/2603.08364v1
- Date: Mon, 09 Mar 2026 13:26:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.089135
- Title: Diffusion-Based Data Augmentation for Image Recognition: A Systematic Analysis and Evaluation
- Title(参考訳): 拡散に基づく画像認識のためのデータ拡張:システム解析と評価
- Authors: Zekun Li, Yinghuan Shi, Yang Gao, Dong Xu,
- Abstract要約: 拡散に基づくデータ拡張(DiffDA)は、データの不足下での分類性能を改善するための有望なアプローチとして現れている。
我々はDiffDAメソッドを3つのコアコンポーネントに分解する統合分析フレームワークUniDiffDAを紹介する。
本フレームワークを基盤として,多種多様な低データ分類タスクにまたがるDiffDA手法をベンチマークする,包括的かつ公平な評価プロトコルを開発した。
- 参考スコア(独自算出の注目度): 42.40873627562592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based data augmentation (DiffDA) has emerged as a promising approach to improving classification performance under data scarcity. However, existing works vary significantly in task configurations, model choices, and experimental pipelines, making it difficult to fairly compare methods or assess their effectiveness across different scenarios. Moreover, there remains a lack of systematic understanding of the full DiffDA workflow. In this work, we introduce UniDiffDA, a unified analytical framework that decomposes DiffDA methods into three core components: model fine-tuning, sample generation, and sample utilization. This perspective enables us to identify key differences among existing methods and clarify the overall design space. Building on this framework, we develop a comprehensive and fair evaluation protocol, benchmarking representative DiffDA methods across diverse low-data classification tasks. Extensive experiments reveal the relative strengths and limitations of different DiffDA strategies and offer practical insights into method design and deployment. All methods are re-implemented within a unified codebase, with full release of code and configurations to ensure reproducibility and to facilitate future research.
- Abstract(参考訳): 拡散に基づくデータ拡張(DiffDA)は、データの不足下での分類性能を改善するための有望なアプローチとして現れている。
しかしながら、既存の作業はタスク構成、モデル選択、実験パイプラインで大きく異なり、メソッドを適切に比較したり、さまざまなシナリオで有効性を評価することは困難です。
さらに、完全なDiffDAワークフローに対する体系的な理解の欠如も残っている。
本稿では,DiffDAメソッドをモデルファインチューニング,サンプル生成,サンプル利用の3つのコアコンポーネントに分解する統合分析フレームワークUniDiffDAを紹介する。
この観点から、既存の手法の主な違いを特定し、全体的な設計空間を明らかにすることができる。
本フレームワークを基盤として,多種多様な低データ分類タスクにまたがるDiffDA手法をベンチマークする,包括的かつ公平な評価プロトコルを開発した。
大規模な実験は、異なるDiffDA戦略の相対的な強みと限界を明らかにし、メソッド設計とデプロイメントに関する実践的な洞察を提供する。
すべてのメソッドは統一されたコードベース内で再実装され、コードと構成の完全なリリースによって再現性を確保し、将来の研究を促進する。
関連論文リスト
- Diffusion Features to Bridge Domain Gap for Semantic Segmentation [2.8616666231199424]
本稿では, 拡散モデルの特徴を効率的に活用するために, サンプリングおよび融合技術を活用するアプローチについて検討する。
テキスト・画像生成能力の強みを生かして、暗黙的に後部知識を学習する新しいトレーニングフレームワークを導入する。
論文 参考訳(メタデータ) (2024-06-02T15:33:46Z) - Key Design Choices in Source-Free Unsupervised Domain Adaptation: An
In-depth Empirical Analysis [16.0130560365211]
本研究では、画像分類におけるSF-UDA(Source-Free Unsupervised Domain Adaptation)のベンチマークフレームワークを提供する。
この研究は、さまざまなSF-UDAテクニックを実証的に検証し、データセット間の一貫性を評価する。
トレーニング済みのデータセットと戦略を徹底的に評価し、特に教師付きおよび自己監督型の手法に重点を置いている。
論文 参考訳(メタデータ) (2024-02-25T13:37:36Z) - Detail Reinforcement Diffusion Model: Augmentation Fine-Grained Visual Categorization in Few-Shot Conditions [11.121652649243119]
拡散モデルは、データ生成において顕著な多様性のため、データ拡張において広く採用されている。
詳細強化拡散モデル(DRDM)と呼ばれる新しい手法を提案する。
大規模モデルの豊富な知識を微粒化に活用し、識別的意味的組換え(DSR)と空間的知識参照(SKR)の2つの重要な構成要素を含む。
論文 参考訳(メタデータ) (2023-09-15T01:28:59Z) - Diffusion-based Visual Counterfactual Explanations -- Towards Systematic
Quantitative Evaluation [64.0476282000118]
視覚的対物的説明法(VCE)の最新手法は、深い生成モデルの力を利用して、印象的な画質の高次元画像の新しい例を合成する。
評価手順が大きく異なり,個々の実例の視覚検査や小規模なユーザスタディなど,これらのVCE手法の性能を比較することは,現時点では困難である。
本稿では,VCE手法の体系的,定量的評価のためのフレームワークと,使用する指標の最小セットを提案する。
論文 参考訳(メタデータ) (2023-08-11T12:22:37Z) - Better Understanding Differences in Attribution Methods via Systematic Evaluations [57.35035463793008]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
これらの評価手法を用いて、広範囲のモデルにおいて広く用いられている属性手法の長所と短所について検討する。
論文 参考訳(メタデータ) (2023-03-21T14:24:58Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。