論文の概要: Style-CCL: Content-Preserving Style Transfer via Curriculum Continual Learning
- arxiv url: http://arxiv.org/abs/2606.14746v1
- Date: Thu, 04 Jun 2026 13:02:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 20:00:42.766401
- Title: Style-CCL: Content-Preserving Style Transfer via Curriculum Continual Learning
- Title(参考訳): Style-CCL: カリキュラム継続学習によるコンテンツ保存スタイル転送
- Authors: Shiwen Zhang, Haoyuan Wang, Xianghao Zang, Haibin Huang, Chi Zhang, Xuelong Li,
- Abstract要約: スタイル転送は、コンテンツとスタイル参照が与えられたとしても、Diffusion Transformersでは依然として困難である。
SC-DiTをセマンティック(容易)からテクスチャ(ハード)スタイルに学習する多段階連続学習フレームワークであるStyle-CCLを提案する。
我々のフレームワークは,スタイルの類似性,コンテントの整合性,美的品質という3つのコアメトリクスで最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 52.33837657928263
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Content-Preserving Style transfer, given content and style references, remains challenging for Diffusion Transformers (DiTs) due to entangled content and style features. With a reverse triplet synthesis pipeline to build a million-scale training set and a dual-branch Style-Content DiT (SC-DiT) that decouples style and content via separate ROPE embeddings and causal masking, we observe that such a one-stage training paradigm on mixed style categories causes semantic styles to dominate, hindering texture style learning, and harming content preservation. To address these issues, we propose Style-CCL, a Multi-Stage Curriculum Continual Learning framework that trains SC-DiT from semantic (easy) to texture (hard) styles, and from clean to synthetic data, with Random Memory Rehearsal across stages to avoid catastrophic forgetting. Extensive experiments demonstrate that our Style-CCL achieves state-of-the-art performance in three core metrics: style similarity, content consistency, and aesthetic quality.
- Abstract(参考訳): コンテンツ保存スタイル転送(コンテンツとスタイル参照)は、コンテンツとスタイルの特徴が絡み合っているため、Diffusion Transformer(DiT)にとって依然として困難である。
逆三重項合成パイプラインを用いて、100万スケールのトレーニングセットと、別個のROPE埋め込みと因果マスクを通じてスタイルとコンテンツを分離するデュアルブランチスタイル・コンテント・DiT(SC-DiT)を構築することにより、混合スタイルカテゴリにおけるそのような一段階のトレーニングパラダイムがセマンティックスタイルを支配し、テクスチャスタイルの学習を阻害し、コンテンツ保存を損なうことが観察された。
そこで我々は,SC-DiTをセマンティック(易易度)からテクスチャ(硬度)のスタイル,クリーンから合成データにトレーニングする多段階連続学習フレームワークであるStyle-CCLを提案する。
大規模な実験により、我々のStyle-CCLは、スタイルの類似性、コンテントの一貫性、美的品質の3つのコアメトリクスで最先端のパフォーマンスを実現しています。
関連論文リスト
- UniCSG: Unified High-Fidelity Content-Constrained Style-Driven Generation via Staged Semantic and Frequency Disentanglement [13.265643008768825]
DiTベースの拡散モデルは、しばしばコンテンツスタイルの絡み合いに悩まされ、参照コンテンツリークと不安定な生成を引き起こす。
テキスト誘導と参照誘導の両方でコンテント制約のあるスタイル駆動型生成のための統合フレームワークUniCSGを提案する。
論文 参考訳(メタデータ) (2026-04-20T05:59:20Z) - Mixture of Style Experts for Diverse Image Stylization [73.7600741657193]
StyleExpertは、Mixture of Experts (MoE)をベースにしたセマンティックアウェアフレームワークである
我々のフレームワークは、コンテンツスタイルのスタイリング三重項の大規模データセットに基づいて訓練された統一型スタイルエンコーダを使用している。
本手法は, 浅いテクスチャから深いセマンティクスまで, 複数のセマンティクスレベルにまたがる多様なスタイルを扱う。
論文 参考訳(メタデータ) (2026-03-17T15:20:19Z) - TeleStyle: Content-Preserving Style Transfer in Images and Videos [52.76027947278353]
画像とビデオの両方をスタイリングするための軽量モデルであるTeleStyleを提示する。
異なるスタイルの高品質なデータセットをキュレートし、数千の多様性のあるイン・ザ・ワイルドなスタイルのカテゴリを使用してトリプレットを合成した。
TeleStyleは、スタイルの類似性、コンテントの一貫性、美的品質という、3つの中核評価指標で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-28T02:16:03Z) - QwenStyle: Content-Preserving Style Transfer with Qwen-Image-Edit [54.11909509184315]
本稿では,Qwen-Image-Editでトレーニングされた最初のコンテンツ保存スタイル転送モデルを提案する。
QwenStyle V1は、スタイルの類似性、コンテントの一貫性、美的品質の3つのコアメトリクスで、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-08T10:22:51Z) - USO: Unified Style and Subject-Driven Generation via Disentangled and Reward Learning [17.75580298339048]
We present U.S.O, a Unified Style-Subject Optimized customization model。
まず、コンテンツ画像、スタイル画像、およびそれに対応するスタイル化されたコンテンツ画像からなる大規模トリプルトデータセットを構築する。
第2に、スタイルの特徴を同時に調整し、スタイルからコンテンツを切り離すアンタングル学習方式を導入する。
第3に、モデルの性能をさらに向上させるために、SRLと表記されるスタイルの報酬学習パラダイムを組み込んだ。
論文 参考訳(メタデータ) (2025-08-26T12:10:24Z) - StyleDistance: Stronger Content-Independent Style Embeddings with Synthetic Parallel Examples [48.44036251656947]
スタイル表現は、内容に関係なく、類似した書体スタイルのテキストを密に埋め込み、異なる書体スタイルのテキストを遠くに埋め込むことを目的としている。
より強力なコンテンツに依存しないスタイル埋め込みをトレーニングするための新しいアプローチであるStyleDistanceを紹介する。
論文 参考訳(メタデータ) (2024-10-16T17:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。