論文の概要: ScoreMix: Synthetic Data Generation by Score Composition in Diffusion Models Improves Recognition
- arxiv url: http://arxiv.org/abs/2506.10226v2
- Date: Fri, 24 Oct 2025 13:03:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.035469
- Title: ScoreMix: Synthetic Data Generation by Score Composition in Diffusion Models Improves Recognition
- Title(参考訳): ScoreMix: 拡散モデルにおけるスコア合成による合成データ生成による認識の改善
- Authors: Parsa Rahimi, Sebastien Marcel,
- Abstract要約: 本稿では,自己完結型合成合成法であるScoreMixを提案する。
このアプローチは、逆拡散軌道に沿ってクラス条件付きスコアを混合し、外部リソースなしでドメイン固有のデータ拡張をもたらす。
- 参考スコア(独自算出の注目度): 2.679486067838086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data generation is increasingly used in machine learning for training and data augmentation. Yet, current strategies often rely on external foundation models or datasets, whose usage is restricted in many scenarios due to policy or legal constraints. We propose ScoreMix, a self-contained synthetic generation method to produce hard synthetic samples for recognition tasks by leveraging the score compositionality of diffusion models. The approach mixes class-conditioned scores along reverse diffusion trajectories, yielding domain-specific data augmentation without external resources. We systematically study class-selection strategies and find that mixing classes distant in the discriminator's embedding space yields larger gains, providing up to 3% additional average improvement, compared to selection based on proximity. Interestingly, we observe that condition and embedding spaces are largely uncorrelated under standard alignment metrics, and the generator's condition space has a negligible effect on downstream performance. Across 8 public face recognition benchmarks, ScoreMix improves accuracy by up to 7 percentage points, without hyperparameter search, highlighting both robustness and practicality. Our method provides a simple yet effective way to maximize discriminator performance using only the available dataset, without reliance on third-party resources. Paper website: https://parsa-ra.github.io/scoremix/.
- Abstract(参考訳): 合成データ生成は、トレーニングやデータ拡張に機械学習でますます利用されている。
しかし、現在の戦略は、しばしば外部の基盤モデルやデータセットに依存しており、ポリシーや法的制約のために多くのシナリオで使用が制限されている。
本研究では,自己完結型合成合成生成法であるScoreMixを提案する。
このアプローチは、逆拡散軌道に沿ってクラス条件付きスコアを混合し、外部リソースなしでドメイン固有のデータ拡張をもたらす。
我々は,クラス選択戦略を体系的に研究し,識別器の埋め込み空間から離れたクラスを混合することにより,最大3%の精度向上が得られることを示した。
興味深いことに、コンディションと埋め込み空間は標準アライメントの指標ではほとんど無関係であり、発電機の状態空間は下流の性能に無視的な影響を及ぼす。
8つの公開顔認証ベンチマークで、ScoreMixはハイパーパラメータ検索なしで最大7ポイントの精度向上を実現し、堅牢性と実用性の両方を強調している。
本手法は,サードパーティのリソースに頼ることなく,利用可能なデータセットのみを用いて,識別器の性能を最大化する,シンプルかつ効果的な方法を提供する。
Paper website: https://parsa-ra.github.io/scoremix/.com
関連論文リスト
- CVOCSemRPL: Class-Variance Optimized Clustering, Semantic Information Injection and Restricted Pseudo Labeling based Improved Semi-Supervised Few-Shot Learning [4.3149314441871205]
半教師付き数発の学習環境では、かなりの量のラベルなしサンプルが利用可能である。
このようなラベルのないサンプルは一般に入手しやすく、モデルの数発の学習性能を向上させるために使用できる。
本稿では,クラスタリングを改善するためにモデルが学習した表現の改善に焦点をあて,その結果,モデル性能について述べる。
論文 参考訳(メタデータ) (2025-01-24T11:14:35Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Classification via score-based generative modelling [0.0]
識別的・生成的分類設定におけるスコアベース学習の適用について検討した。
シミュレーションおよび実世界のデータセットについて実験を行い、バイナリ分類性能の達成と改善の有効性を実証した。
論文 参考訳(メタデータ) (2022-07-22T13:59:43Z) - Harnessing Hard Mixed Samples with Decoupled Regularizer [69.98746081734441]
Mixupは、決定境界を混合データで滑らかにすることで、ニューラルネットワークの一般化を改善する効率的なデータ拡張アプローチである。
本稿では,非結合型正規化器(Decoupled Mixup, DM)を用いた効率的な混合目標関数を提案する。
DMは、ミキシングの本来の滑らかさを損なうことなく、硬質混合試料を適応的に利用して識別特性をマイニングすることができる。
論文 参考訳(メタデータ) (2022-03-21T07:12:18Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Robust Federated Learning: The Case of Affine Distribution Shifts [41.27887358989414]
我々は,ユーザのサンプルの分布変化に対して良好な性能を実現するための,堅牢なフェデレーション学習アルゴリズムを開発した。
新しいテストユーザにおいて,アフィン分布シフトは学習者分類器の性能を著しく低下させるのに十分であることを示す。
論文 参考訳(メタデータ) (2020-06-16T03:43:59Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。