論文の概要: StyDeco: Unsupervised Style Transfer with Distilling Priors and Semantic Decoupling
- arxiv url: http://arxiv.org/abs/2508.01215v1
- Date: Sat, 02 Aug 2025 06:17:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.762638
- Title: StyDeco: Unsupervised Style Transfer with Distilling Priors and Semantic Decoupling
- Title(参考訳): StyDeco: 蒸留プリミティブとセマンティックデカップリングによる教師なしスタイル転送
- Authors: Yuanlin Yang, Quanjian Song, Zhexian Gao, Ge Wang, Shanshan Li, Xiaoyan Zhang,
- Abstract要約: StyDecoは、スタイル転送タスクに適したテキスト表現を学習する教師なしのフレームワークである。
本フレームワークは, 構造的忠実度と構造的保存性の両方において, 既存手法より優れる。
- 参考スコア(独自算出の注目度): 5.12285618196312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have emerged as the dominant paradigm for style transfer, but their text-driven mechanism is hindered by a core limitation: it treats textual descriptions as uniform, monolithic guidance. This limitation overlooks the semantic gap between the non-spatial nature of textual descriptions and the spatially-aware attributes of visual style, often leading to the loss of semantic structure and fine-grained details during stylization. In this paper, we propose StyDeco, an unsupervised framework that resolves this limitation by learning text representations specifically tailored for the style transfer task. Our framework first employs Prior-Guided Data Distillation (PGD), a strategy designed to distill stylistic knowledge without human supervision. It leverages a powerful frozen generative model to automatically synthesize pseudo-paired data. Subsequently, we introduce Contrastive Semantic Decoupling (CSD), a task-specific objective that adapts a text encoder using domain-specific weights. CSD performs a two-class clustering in the semantic space, encouraging source and target representations to form distinct clusters. Extensive experiments on three classic benchmarks demonstrate that our framework outperforms several existing approaches in both stylistic fidelity and structural preservation, highlighting its effectiveness in style transfer with semantic preservation. In addition, our framework supports a unique de-stylization process, further demonstrating its extensibility. Our code is vailable at https://github.com/QuanjianSong/StyDeco.
- Abstract(参考訳): 拡散モデルはスタイル伝達の主要なパラダイムとして現れてきたが、そのテキスト駆動メカニズムは、テキスト記述を一様でモノリシックなガイダンスとして扱うという、中核的な制限によって妨げられている。
この制限は、テクスト記述の非空間的な性質と視覚スタイルの空間的に認識される属性とのセマンティックなギャップを見落とし、しばしばスタイリング中に意味構造が失われ、きめ細かな細部が細分化される。
本稿では,スタイル転送タスクに適したテキスト表現を学習することで,この制限を解消する,教師なしのフレームワークであるStyDecoを提案する。
筆者らのフレームワークはまず,人的監督なしにスタイリスティックな知識を蒸留するPGD(Presideed-Guided Data Distillation)を採用している。
強力な凍結生成モデルを利用して、擬似ペアデータを自動的に合成する。
次に、ドメイン固有の重みを使ってテキストエンコーダを適応させるタスク固有の目的であるContrastive Semantic Decoupling (CSD)を紹介する。
CSDはセマンティック空間で2クラスクラスタリングを行い、ソースとターゲット表現に異なるクラスタを形成するよう奨励する。
3つの古典的ベンチマークの大規模な実験により、我々のフレームワークは、スタイルの忠実さと構造的保存の両方において、いくつかの既存のアプローチよりも優れており、セマンティックな保存によるスタイル伝達の有効性を強調している。
さらに,本フレームワークは独自の脱スティル化プロセスをサポートし,拡張性を示す。
私たちのコードはhttps://github.com/QuanjianSong/StyDeco.comで利用可能です。
関連論文リスト
- Cross-Layer Discrete Concept Discovery for Interpreting Language Models [13.842670153893977]
クロス層VQ-VAEは、ベクトル量子化を使用して層間の表現をマッピングするフレームワークである。
本手法は,量子化中のトップk温度に基づくサンプリングとEMAコードブック更新を一意に組み合わせる。
論文 参考訳(メタデータ) (2025-06-24T22:43:36Z) - CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.15827818829865]
2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文 参考訳(メタデータ) (2025-05-26T19:09:33Z) - Implementing Long Text Style Transfer with LLMs through Dual-Layered Sentence and Paragraph Structure Extraction and Mapping [6.445040420833822]
文レベルのスタイリスティック適応と段落レベルの構造的コヒーレンスを組み合わせた階層的枠組みを提案する。
提案するフレームワークであるZeroStylusは,参照テキストからの階層的テンプレート取得とマルチグラニュラマッチングによるテンプレート誘導生成という,2つの体系的なフェーズで運用する。
論文 参考訳(メタデータ) (2025-05-11T05:53:33Z) - Personalized Text Generation with Contrastive Activation Steering [63.60368120937822]
そこで本研究では,ベクタとしてパーソナライズされた書体スタイルを分離し,表現する学習自由フレームワークを提案する。
本フレームワークは,PEFT法よりも1700倍のストレージ要求を削減しつつ,パーソナライズ生成において,8%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2025-03-07T08:07:15Z) - ArtWeaver: Advanced Dynamic Style Integration via Diffusion Model [73.95608242322949]
Stylized Text-to-Image Generation (STIG)は、テキストプロンプトとスタイル参照画像から画像を生成することを目的としている。
我々は、事前訓練された安定拡散を利用して、誤解釈スタイルや一貫性のない意味論といった課題に対処する新しいフレームワーク、ArtWeaverを提案する。
論文 参考訳(メタデータ) (2024-05-24T07:19:40Z) - ParaGuide: Guided Diffusion Paraphrasers for Plug-and-Play Textual Style
Transfer [57.6482608202409]
テキストスタイル転送は、意味を保ちながらテキストのスタイル特性を変換するタスクである。
任意のスタイルに柔軟に適応できる汎用型転送のための新しい拡散型フレームワークを提案する。
本研究では,人的評価と自動評価の両面から,Enron Email Corpusの手法を検証するとともに,形式性,感情,さらにはオーサシップスタイルの伝達にも優れることを示す。
論文 参考訳(メタデータ) (2023-08-29T17:36:02Z) - Towards Robust and Semantically Organised Latent Representations for
Unsupervised Text Style Transfer [6.467090475885798]
この摂動モデルを完成させるEPAAE(Perturbed Adrial AutoEncoders)を導入する。
これは、(a)スタイル的に類似した文をまとめるより優れた組織化された潜在空間を生み出すことを実証的に示す。
また、テキストスタイルの転送タスクをNLIデータセットに拡張し、これらのより複雑なスタイル定義がEPAAEによって最もよく学習されていることを示す。
論文 参考訳(メタデータ) (2022-05-04T20:04:24Z) - GTAE: Graph-Transformer based Auto-Encoders for Linguistic-Constrained
Text Style Transfer [119.70961704127157]
近年,非並列テキストスタイルの転送が研究の関心を集めている。
現在のアプローチでは、元の文の内容やロジックを保存できない。
文を言語グラフとしてモデル化し,グラフレベルで特徴抽出とスタイル転送を行う,グラフトランスフォーマーベースのAuto-GTAEを提案する。
論文 参考訳(メタデータ) (2021-02-01T11:08:45Z) - Contextual Text Style Transfer [73.66285813595616]
コンテキストテキストスタイル転送は、文をその周囲のコンテキストを考慮した所望のスタイルに変換することを目的としている。
本稿では,各入力文とその周辺コンテキストに対して2つの異なるエンコーダを使用するコンテキスト認識スタイル転送(CAST)モデルを提案する。
Enron-ContextとReddit-Contextという2つの新しいベンチマークが、フォーマル性と攻撃性スタイルの転送のために導入された。
論文 参考訳(メタデータ) (2020-04-30T23:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。