論文の概要: Beyond Binary Preference: Aligning Diffusion Models to Fine-grained Criteria by Decoupling Attributes
- arxiv url: http://arxiv.org/abs/2601.04300v1
- Date: Wed, 07 Jan 2026 18:11:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:52.873805
- Title: Beyond Binary Preference: Aligning Diffusion Models to Fine-grained Criteria by Decoupling Attributes
- Title(参考訳): 二項選好を超えて:属性の分離による細粒度基準への拡散モデルの適用
- Authors: Chenye Meng, Zejian Li, Zhongni Liu, Yize Li, Changle Xie, Kaixin Jia, Ling Yang, Huanghuang Deng, Shiying Ding, Shengyuan Zhang, Jiayi Li, Lingyun Sun,
- Abstract要約: 拡散モデルの訓練後のアライメントは、二進選好のような単純化された信号に依存している。
まずドメイン知識をSupervised Fine-Tuningを介して補助拡散モデルに注入する。
第2に、DPOを拡張した複素選好最適化(CPO)を導入し、ターゲット拡散を我々の非二項的階層的基準に合わせる。
- 参考スコア(独自算出の注目度): 27.134465268189814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Post-training alignment of diffusion models relies on simplified signals, such as scalar rewards or binary preferences. This limits alignment with complex human expertise, which is hierarchical and fine-grained. To address this, we first construct a hierarchical, fine-grained evaluation criteria with domain experts, which decomposes image quality into multiple positive and negative attributes organized in a tree structure. Building on this, we propose a two-stage alignment framework. First, we inject domain knowledge to an auxiliary diffusion model via Supervised Fine-Tuning. Second, we introduce Complex Preference Optimization (CPO) that extends DPO to align the target diffusion to our non-binary, hierarchical criteria. Specifically, we reformulate the alignment problem to simultaneously maximize the probability of positive attributes while minimizing the probability of negative attributes with the auxiliary diffusion. We instantiate our approach in the domain of painting generation and conduct CPO training with an annotated dataset of painting with fine-grained attributes based on our criteria. Extensive experiments demonstrate that CPO significantly enhances generation quality and alignment with expertise, opening new avenues for fine-grained criteria alignment.
- Abstract(参考訳): 拡散モデルの訓練後のアライメントは、スカラー報酬や二進選好のような単純化された信号に依存している。
これは、階層的できめ細かい複雑な人間の専門知識との整合性を制限する。
そこで我々はまず,画像品質を複数の正負の属性と負の属性に分解する階層的,きめ細かい評価基準を構築した。
これに基づいて,2段階のアライメントフレームワークを提案する。
まずドメイン知識をSupervised Fine-Tuningを介して補助拡散モデルに注入する。
第2に、DPOを拡張した複素選好最適化(CPO)を導入し、ターゲット拡散を我々の非二項的階層的基準に合わせる。
具体的には、アライメント問題を再構成し、正の属性の確率を同時に最大化するとともに、補助拡散を伴う負の属性の確率を最小化する。
我々は,絵画生成分野におけるアプローチをインスタンス化し,私たちの基準に基づいて,微粒な属性を持つ注釈付き絵画データセットを用いてCPO訓練を行う。
大規模な実験により、CPOは生成品質と専門知識との整合性を著しく向上し、きめ細かい基準調整のための新たな道を開くことが示されている。
関連論文リスト
- Attribute Fusion-based Classifier on Framework of Belief Structure [46.24928730489845]
Dempster-Shafer Theory (DST)は、不確実性をモデリングするための強力なフレームワークを提供し、多属性分類タスクに広く適用されてきた。
従来のDSTに基づく属性融合型分類器は、単純化されたメンバーシップ関数モデリングと基本確率割当(BPA)による信念構造の限定的活用に悩まされている。
本稿では,2つの重要なイノベーションを通じて,これらの制限に対処する属性融合型分類器を提案する。
論文 参考訳(メタデータ) (2025-08-31T09:05:15Z) - TwinTURBO: Semi-Supervised Fine-Tuning of Foundation Models via Mutual Information Decompositions for Downstream Task and Latent Spaces [10.86297454943578]
本稿では,限られたラベル付きデータに対するトレーニングの課題に対処する,半教師付き微調整フレームワークを提案する。
いくつかのデータセットの実験では、極低ラベル条件下での分類タスクが大幅に改善された。
論文 参考訳(メタデータ) (2025-03-10T20:56:54Z) - Calibrated Multi-Preference Optimization for Aligning Diffusion Models [90.15024547673785]
Calibrated Preference Optimization (CaPO) は、テキスト・ツー・イメージ(T2I)拡散モデルを調整する新しい手法である。
CaPOは、人間の注釈のない複数の報酬モデルからの一般的な好みを取り入れている。
実験結果から, CaPOは従来法よりも常に優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-02-04T18:59:23Z) - Bi-discriminator Domain Adversarial Neural Networks with Class-Level
Gradient Alignment [87.8301166955305]
そこで本研究では,クラスレベルのアライメントアライメントを有するバイディミネータドメイン対向ニューラルネットワークを提案する。
BACGは、領域分布の整合性を改善するために勾配信号と二階確率推定を利用する。
さらに、対照的な学習にインスパイアされ、トレーニングプロセスを大幅に短縮できるメモリバンクベースの変種であるFast-BACGを開発した。
論文 参考訳(メタデータ) (2023-10-21T09:53:17Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Bi-Directional Generation for Unsupervised Domain Adaptation [61.73001005378002]
教師なしのドメイン適応は、確立されたソースドメイン情報に依存するラベルなしのターゲットドメインを促進する。
従来の手法では、潜在空間におけるドメインの不一致を強制的に低減することで、本質的なデータ構造が破壊される。
本稿では、2つの中間領域をブリッジソースとターゲットドメインに補間する一貫した分類器を用いた双方向生成ドメイン適応モデルを提案する。
論文 参考訳(メタデータ) (2020-02-12T09:45:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。