論文の概要: Controllable Stylistic Text Generation with Train-Time Attribute-Regularized Diffusion
- arxiv url: http://arxiv.org/abs/2510.06386v1
- Date: Tue, 07 Oct 2025 19:09:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.161642
- Title: Controllable Stylistic Text Generation with Train-Time Attribute-Regularized Diffusion
- Title(参考訳): 列車時間属性正規化拡散による安定テキスト生成
- Authors: Fan Zhou, Chang Tian, Tim Van de Cruys,
- Abstract要約: 特定の属性でスタイリスティックテキストを生成することは、制御可能なテキスト生成の鍵となる問題である。
RegDiffは正規化された拡散フレームワークで、サンプリング中に事前訓練された分類器を必要とせずに属性機能を利用する。
複数のスタイリスティックな属性にまたがる5つのデータセットの実験では、RegDiffはスタイリスティックなテキストを生成する上で、強いベースラインよりも優れています。
- 参考スコア(独自算出の注目度): 10.081440429184587
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Generating stylistic text with specific attributes is a key problem in controllable text generation. Recently, diffusion models have emerged as a powerful paradigm for both visual and textual generation. Existing approaches can be broadly categorized into classifier-free guidance (CFG) and classifier guidance (CG) methods. While CFG effectively preserves semantic content, it often fails to provide effective attribute control. In contrast, CG modifies the denoising trajectory using classifier gradients, enabling better attribute alignment but incurring high computational costs during sampling and suffering from classifier generalization issues. In this work, we propose RegDiff, a regularized diffusion framework that leverages attribute features without requiring a pretrained classifier during sampling, thereby achieving controllable generation with reduced computational costs. Specifically, RegDiff employs a VAE-based encoder--decoder architecture to ensure reconstruction fidelity and a latent diffusion model trained with attribute supervision to enable controllable text generation. Attribute information is injected only during training. Experiments on five datasets spanning multiple stylistic attributes demonstrate that RegDiff outperforms strong baselines in generating stylistic texts. These results validate the effectiveness of RegDiff as an efficient solution for attribute-controllable text diffusion. Our code, datasets, and resources will be released upon publication at https://github.com/xxxx.
- Abstract(参考訳): 特定の属性でスタイリスティックテキストを生成することは、制御可能なテキスト生成の鍵となる問題である。
近年,拡散モデルは視覚的・テキスト的生成において強力なパラダイムとして出現している。
既存のアプローチは、分類器フリーガイダンス(CFG)と分類器フリーガイダンス(CG)に大別できる。
CFGはセマンティックコンテンツを効果的に保存するが、しばしば効果的な属性制御を提供しない。
これとは対照的に、CGは分類器勾配を用いて偏微分軌道を修正し、より優れた属性アライメントを実現するが、サンプリング時に高い計算コストを発生させ、分類器一般化問題に悩まされる。
本研究では,サンプリング中に事前学習した分類器を必要とせずに属性特徴を利用する正規化拡散フレームワークRegDiffを提案し,計算コストを低減して制御可能な生成を実現する。
具体的には、RegDiffはVAEベースのエンコーダ-デコーダアーキテクチャを使用して、再構成の忠実性を確保するとともに、属性管理によってトレーニングされた潜在拡散モデルを用いて、制御可能なテキスト生成を可能にする。
属性情報はトレーニング中にのみ注入される。
複数のスタイリスティックな属性にまたがる5つのデータセットの実験では、RegDiffはスタイリスティックなテキストを生成する上で、強いベースラインよりも優れています。
これらの結果は、属性制御可能なテキスト拡散の効率的な解法としてRegDiffの有効性を検証する。
私たちのコード、データセット、リソースはhttps://github.com/xxxx.comで公開される。
関連論文リスト
- Towards Transformer-Based Aligned Generation with Self-Coherence Guidance [51.42269790543461]
トランスフォーマーを用いたテキストガイド拡散モデル(TGDM)におけるアライメント向上のためのトレーニング不要アプローチを提案する。
既存のTGDMは、特に複雑なテキストプロンプトやマルチコンセプト属性バインディングの問題を扱う場合、意味的に整合した画像を生成するのに苦労することが多い。
本手法は,生成過程において,相互注意マップを直接最適化することにより,これらの課題に対処する。
論文 参考訳(メタデータ) (2025-03-22T07:03:57Z) - Air-Decoding: Attribute Distribution Reconstruction for Decoding-Time
Controllable Text Generation [58.911255139171075]
制御可能なテキスト生成(CTG)は、望ましい属性を持つテキストを生成することを目的としている。
本研究では,Air-Decoding という新しい軽量デコーディングフレームワークを提案する。
提案手法は,新しい最先端制御性能を実現する。
論文 参考訳(メタデータ) (2023-10-23T12:59:11Z) - FAST: Improving Controllability for Text Generation with Feedback Aware
Self-Training [25.75982440355576]
制御可能なテキスト生成システムは、しばしば制御コードを利用して、スタイルや長さといった出力の様々な特性を指示する。
NLPの因果推論に関する最近の研究に触発された本論文は、これらの制御符号に基づく条件付きテキスト生成アルゴリズムにおいて、これまで見過ごされていた欠陥を明らかにする。
トレーニングセットにおけるこれらの相関を減少させるための2つの簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-10-06T19:00:51Z) - Classifiers are Better Experts for Controllable Text Generation [63.17266060165098]
提案手法は, PPLにおける最近のPPLM, GeDi, DExpertsよりも有意に優れており, 生成したテキストの外部分類器に基づく感情の精度が高いことを示す。
同時に、実装やチューニングも簡単で、制限や要件も大幅に少なくなります。
論文 参考訳(メタデータ) (2022-05-15T12:58:35Z) - Multi-Attribute Balanced Sampling for Disentangled GAN Controls [0.0]
予め訓練されたGANの潜伏空間から、生成されたデータに対する様々な制御を抽出することができる。
提案手法は,非絡み付き後処理の不要さを回避しつつ,最先端の分類器に基づく手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-28T08:44:13Z) - Latent Template Induction with Gumbel-CRFs [107.17408593510372]
文生成のための潜在テンプレートを推論するための構造化変分オートエンコーダについて検討する。
構造化推論ネットワークとして、トレーニング中に解釈可能なテンプレートを学習することを示す。
論文 参考訳(メタデータ) (2020-11-29T01:00:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。