Fugu-MT 論文翻訳(概要): Analyzing and Mitigating Model Collapse in Rectified Flow Models

論文の概要: Analyzing and Mitigating Model Collapse in Rectified Flow Models

arxiv url: http://arxiv.org/abs/2412.08175v2
Date: Sun, 09 Feb 2025 10:02:55 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-11 16:44:24.628416
Title: Analyzing and Mitigating Model Collapse in Rectified Flow Models
Title（参考訳）: 凝固流モデルにおけるモデル崩壊の解析と緩和
Authors: Huminhao Zhu, Fangyikang Wang, Tianyu Ding, Qing Qu, Zhihui Zhu,
Abstract要約: 近年の研究では、自己生成サンプルの繰り返しトレーニングがモデル崩壊につながることが示されている。拡散流モデルにおけるMCに対処するための理論的解析と実用的な解を提供する。本稿では,Real-data Augmented Reflowと一連の改良型を提案する。
参考スコア（独自算出の注目度）: 23.568835948164065
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Training with synthetic data is becoming increasingly inevitable as synthetic content proliferates across the web, driven by the remarkable performance of recent deep generative models. This reliance on synthetic data can also be intentional, as seen in Rectified Flow models, whose Reflow method iteratively uses self-generated data to straighten the flow and improve sampling efficiency. However, recent studies have shown that repeatedly training on self-generated samples can lead to model collapse (MC), where performance degrades over time. Despite this, most recent work on MC either focuses on empirical observations or analyzes regression problems and maximum likelihood objectives, leaving a rigorous theoretical analysis of reflow methods unexplored. In this paper, we aim to fill this gap by providing both theoretical analysis and practical solutions for addressing MC in diffusion/flow models. We begin by studying Denoising Autoencoders and prove performance degradation when DAEs are iteratively trained on their own outputs. To the best of our knowledge, we are the first to rigorously analyze model collapse in DAEs and, by extension, in diffusion models and Rectified Flow. Our analysis and experiments demonstrate that rectified flow also suffers from MC, leading to potential performance degradation in each reflow step. Additionally, we prove that incorporating real data can prevent MC during recursive DAE training, supporting the recent trend of using real data as an effective approach for mitigating MC. Building on these insights, we propose a novel Real-data Augmented Reflow and a series of improved variants, which seamlessly integrate real data into Reflow training by leveraging reverse flow. Empirical evaluations on standard image benchmarks confirm that RA Reflow effectively mitigates model collapse, preserving high-quality sample generation even with fewer sampling steps.
Abstract（参考訳）: 近年の深層生成モデルの顕著な性能により, 合成コンテンツがWeb全体に普及するにつれて, 合成データによるトレーニングはますます避けられないものになりつつある。 Rectified Flowモデルに見られるように、この合成データへの依存も意図的であり、Reflowメソッドは自己生成データを反復的に使用して、フローのストレート化とサンプリング効率の向上を実現している。しかし、最近の研究では、自己生成サンプルの繰り返しトレーニングがモデル崩壊(MC)を引き起こすことが示されている。これにもかかわらず、MCに関する最近の研究は経験的な観察に焦点を当てるか、回帰問題と最大可能性目的を分析し、リフロー法の厳密な理論的分析を未解明のまま残している。本稿では,拡散流モデルにおけるMCに対処するための理論的解析と実用的な解を提供することにより,このギャップを埋めることを目的とする。まず、自動エンコーダのDenoising Autoencoderの研究から始め、DAEが自身の出力で反復的にトレーニングされている場合のパフォーマンス劣化を証明します。我々の知る限りでは、私たちはDAEのモデル崩壊と拡張によって拡散モデルとRectified Flowで厳密に分析した最初の人です。解析および実験により, 整流流もMCに悩まされ, 各再流工程における性能劣化の可能性が示唆された。さらに、実データの導入は、再帰的DAEトレーニング中にMCを防止できることを証明し、MCを緩和するための効果的なアプローチとして、近年のリアルデータの使用傾向を裏付ける。これらの知見に基づいて,Real-data Augmented Reflowと一連の改良版を提案し,リバースフローを活用することで,リアルデータをReflowトレーニングにシームレスに統合する。標準画像ベンチマークの実証評価により、RA Reflowはモデル崩壊を効果的に軽減し、サンプリングステップが少なくても高品質なサンプル生成を維持できることを確認した。

関連論文リスト

ResPF: Residual Poisson Flow for Efficient and Physically Consistent Sparse-View CT Reconstruction [7.644299873269135]
スパース・ビュー・コンピュート・トモグラフィー(CT)は、放射線線量を減らすための実用的な方法であるが、結果として生じる逆問題により、正確な画像再構成に重大な課題が生じる。生成モデリングの最近の進歩、特にポアソンフロー生成モデル(PFGM)は、高忠実度画像合成を可能にする。本稿では, 残余ポアソンフロー(ResPF)生成モデルを提案する。
論文参考訳（メタデータ） (2025-06-06T01:43:35Z)
Model-agnostic Mitigation Strategies of Data Imbalance for Regression [0.0]
データ不均衡は、回帰タスクにおいて広範囲にわたる課題として持続し、モデルパフォーマンスのバイアスを導入し、予測信頼性を損なう。既存のサンプリング手法を構築・改善する高度な緩和手法を提案する。モデルのアンサンブル(不均衡緩和で訓練されたモデルと、非バランスで訓練されたモデル)の構築は、これらの負の効果を著しく減少させることを実証する。
論文参考訳（メタデータ） (2025-06-02T09:46:08Z)
A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文参考訳（メタデータ） (2025-02-26T06:18:13Z)
Feasible Learning [78.6167929413604]
本稿では,サンプル中心の学習パラダイムであるFeasible Learning(FL)を紹介する。大規模言語モデルにおける画像分類, 年齢回帰, 好みの最適化といった経験的分析により, FLを用いて訓練したモデルでは, 平均的性能に限界があるものの, ERMと比較して改善された尾の挙動を示しながらデータから学習できることが実証された。
論文参考訳（メタデータ） (2025-01-24T20:39:38Z)
FlowDAS: A Flow-Based Framework for Data Assimilation [15.64941169350615]
FlowDASは、状態遷移ダイナミクスと生成前の学習を統合するために補間剤を用いた新しい生成モデルベースのフレームワークである。実験では,ローレンツシステムから高次元流体超解像タスクに至るまで,様々なベンチマークにおいてFlowDASの優れた性能を示す。
論文参考訳（メタデータ） (2025-01-13T05:03:41Z)
Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文参考訳（メタデータ） (2024-02-19T02:08:09Z)
TC-DiffRecon: Texture coordination MRI reconstruction method based on diffusion model and modified MF-UNet method [2.626378252978696]
本稿では,T-DiffReconという名前の拡散モデルに基づくMRI再構成法を提案する。また、モデルにより生成されたMRI画像の品質を高めるために、MF-UNetモジュールを組み込むことを提案する。
論文参考訳（メタデータ） (2024-02-17T13:09:00Z)
Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文参考訳（メタデータ） (2023-11-22T15:07:59Z)
The Missing U for Efficient Diffusion Models [3.712196074875643]
拡散確率モデル(Diffusion Probabilistic Models)は、画像合成、ビデオ生成、分子設計などのタスクにおいて、記録破りのパフォーマンスをもたらす。それらの能力にもかかわらず、その効率、特に逆過程では、収束速度が遅いことと計算コストが高いため、依然として課題である。本研究では,連続力学系を利用した拡散モデルのための新しいデノナイジングネットワークの設計手法を提案する。
論文参考訳（メタデータ） (2023-10-31T00:12:14Z)
Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文参考訳（メタデータ） (2023-05-11T17:55:25Z)
Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T15:32:59Z)
Exploring Continual Learning of Diffusion Models [24.061072903897664]
拡散モデルの連続学習(CL)特性を評価する。我々は,拡散の時間経過にまたがる多様な行動を示す,忘れのダイナミクスに関する洞察を提供する。
論文参考訳（メタデータ） (2023-03-27T15:52:14Z)
A Physics-informed Diffusion Model for High-fidelity Flow Field Reconstruction [0.0]
本研究では,高忠実度データのみを使用する拡散モデルを提案する。異なる構成で、本モデルでは、正規の低忠実度サンプルまたはスパース測定サンプルから高忠実度データを再構成することができる。本モデルでは, 異なる入力源に基づく2次元乱流の正確な再構成結果が得られるが, 再学習は行わない。
論文参考訳（メタデータ） (2022-11-26T23:14:18Z)
Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。 CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文参考訳（メタデータ） (2021-05-18T15:13:00Z)
DeFlow: Learning Complex Image Degradations from Unpaired Data with Conditional Flows [145.83812019515818]
本論文では,不対データから画像劣化を学習するDeFlowを提案する。共有フローデコーダネットワークの潜在空間における劣化過程をモデル化する。共同画像復元と超解像におけるDeFlowの定式化を検証した。
論文参考訳（メタデータ） (2021-01-14T18:58:01Z)
Model-based Policy Optimization with Unsupervised Model Adaptation [37.09948645461043]
本研究では,不正確なモデル推定による実データとシミュレーションデータのギャップを埋めて,より良いポリシ最適化を実現する方法について検討する。本稿では,教師なしモデル適応を導入したモデルベース強化学習フレームワークAMPOを提案する。提案手法は,一連の連続制御ベンチマークタスクにおけるサンプル効率の観点から,最先端の性能を実現する。
論文参考訳（メタデータ） (2020-10-19T14:19:42Z)
MCFlow: Monte Carlo Flow Models for Data Imputation [18.797803883183793]
本稿では, 正規化フロー生成モデルとモンテカルロサンプリングを利用する計算用フレームワークMCFlowを提案する。本稿では,提案手法の有効性を,標準多変量および画像データセット上で実証的に検証する。 MCFlowは, インプットされたデータの品質や, データのセマンティックな構造を維持する能力において, 競合する手法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-03-27T20:33:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。