Fugu-MT 論文翻訳(概要): A Dense Reward View on Aligning Text-to-Image Diffusion with Preference

論文の概要: A Dense Reward View on Aligning Text-to-Image Diffusion with Preference

arxiv url: http://arxiv.org/abs/2402.08265v1
Date: Tue, 13 Feb 2024 07:37:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-14 16:19:45.861166
Title: A Dense Reward View on Aligning Text-to-Image Diffusion with Preference
Title（参考訳）: テキストと画像の拡散を優先的に調整するDense Reward View
Authors: Shentao Yang, Tianqi Chen, Mingyuan Zhou
Abstract要約: 本稿では,T2I逆鎖の初期ステップを強調する,トラクタブルアライメントの目的を提案する。単一および複数プロンプト生成の実験では,本手法は強い関連するベースラインと競合する。
参考スコア（独自算出の注目度）: 61.175861413985054
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Aligning text-to-image diffusion model (T2I) with preference has been gaining increasing research attention. While prior works exist on directly optimizing T2I by preference data, these methods are developed under the bandit assumption of a latent reward on the entire diffusion reverse chain, while ignoring the sequential nature of the generation process. From literature, this may harm the efficacy and efficiency of alignment. In this paper, we take on a finer dense reward perspective and derive a tractable alignment objective that emphasizes the initial steps of the T2I reverse chain. In particular, we introduce temporal discounting into the DPO-style explicit-reward-free loss, to break the temporal symmetry therein and suit the T2I generation hierarchy. In experiments on single and multiple prompt generation, our method is competitive with strong relevant baselines, both quantitatively and qualitatively. Further studies are conducted to illustrate the insight of our approach.
Abstract（参考訳）: 好みのテキスト・画像拡散モデル(T2I)が研究の注目を集めている。優先データによるT2Iを直接最適化する以前の研究は存在するが、これらの手法は、生成過程のシーケンシャルな性質を無視しつつ、拡散逆鎖全体の遅延報酬のバンドイット仮定の下で開発されている。文学上、これはアライメントの有効性と効率を損なう可能性がある。本稿では, t2i逆鎖の初期段階を強調する, より精細な報酬の視点を取り, 移動可能なアライメント目標を導出する。特に,dpoスタイルの明示的後退損失に時間的ディスカウントを導入し,時間対称性を壊し,t2i生成階層に適合させる。単一および複数プロンプト生成実験において,本手法は定量的および定性的に,強い関連するベースラインと競合する。我々のアプローチの洞察を説明するために、さらなる研究が行われた。

関連論文リスト

Motion Prior Distillation in Time Reversal Sampling for Generative Inbetweening [23.537461698380607]
本稿では, 簡易かつ効果的な推定時間蒸留技術である運動優先蒸留(MPD)を提案する。 MPDは前方経路の運動残差を後方経路に蒸留することで双方向のミスマッチを抑制する。本手法は,経路のあいまいさの原因となる条件付き経路を意図的に denoizing することを避けることができる。
論文参考訳（メタデータ） (2026-02-13T07:20:45Z)
DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation in Text-to-Image Models [55.30555646945055]
テキスト・ツー・イメージ(T2I)モデルはセマンティック・リークに対して脆弱である。 DeLeakerは、モデルのアテンションマップに直接介入することで、漏洩を緩和する軽量なアプローチである。 SLIMはセマンティックリークに特化した最初のデータセットである。
論文参考訳（メタデータ） (2025-10-16T17:39:21Z)
Diverse Text-to-Image Generation via Contrastive Noise Optimization [60.48914865049489]
テキスト・ツー・イメージ(T2I)拡散モデルは高忠実度画像の生成において顕著な性能を示した。既存のアプローチは通常、推論中に中間の潜伏状態やテキスト条件を最適化する。本稿では,多様性問題に異なる視点から対処する簡易かつ効果的な手法であるContrastive Noise Optimizationを紹介する。
論文参考訳（メタデータ） (2025-10-04T13:51:32Z)
MIRA: Towards Mitigating Reward Hacking in Inference-Time Alignment of T2I Diffusion Models [86.07486858219137]
拡散モデルは、テキストプロンプトに条件付けされた画像を生成するのに優れている。得られた画像は、Aesthetic Scoresのようなスカラー報酬によって測定されるユーザ固有の基準を満たさないことが多い。近年,ノイズ最適化による推定時間アライメントが,効率的な代替手段として浮上している。このアプローチは報酬のハッキングに苦しめられ、モデルが高いスコアの画像を生成できるが、元のプロンプトとはかなり異なる。
論文参考訳（メタデータ） (2025-10-02T00:47:36Z)
Free Lunch Alignment of Text-to-Image Diffusion Models without Preference Image Pairs [36.42060582800515]
本稿では,T2Iモデルの"フリーランチ"アライメントを可能にするフレームワークであるText Preference Optimization (TPO)を紹介する。 TPOは、ミスマッチしたプロンプトよりもマッチしたプロンプトを好むようにモデルを訓練することで機能する。我々のフレームワークは汎用的で、既存の嗜好ベースのアルゴリズムと互換性がある。
論文参考訳（メタデータ） (2025-09-30T04:32:34Z)
Enhancing Diffusion-based Unrestricted Adversarial Attacks via Adversary Preferences Alignment [26.95607772298534]
APA(Adversary Preferences Alignment)は、競合する好みを分離し、異なる報酬でそれぞれを最適化する2段階のフレームワークである。 APAは高い視覚的整合性を保ちながら、より優れた攻撃伝達性を実現し、アライメントの観点から敵攻撃にアプローチするためのさらなる研究を促している。
論文参考訳（メタデータ） (2025-06-02T10:18:09Z)
Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models [52.877452505561706]
データセットのオーナシップ検証(DOV)を損なうよう特別に設計された最初の著作権回避攻撃を提案する。 CEAT2Iは, 試料検出, トリガー同定, 効率的な透かし除去の3段階からなる。実験の結果,CEAT2I はモデル性能を保ちながら DOV 機構を効果的に回避できることがわかった。
論文参考訳（メタデータ） (2025-05-05T17:51:55Z)
GenDR: Lightning Generative Detail Restorator [18.465568249533966]
我々は,より大きい潜伏空間を持つテーラー拡散モデルから抽出した生成詳細復元のための1段階拡散モデルGenDRを提案する。実験の結果,GenDRは定量的な測定値と視覚的忠実度の両方で最先端の性能を達成できた。
論文参考訳（メタデータ） (2025-03-09T22:02:18Z)
Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design [87.58981407469977]
進化的アルゴリズムにインスパイアされた拡散モデルを用いた推論時間報酬最適化のための新しいフレームワークを提案する。当社のアプローチでは,各イテレーションにおける2つのステップ – ノイズ発生と報酬誘導という,反復的な改善プロセスを採用しています。
論文参考訳（メタデータ） (2025-02-20T17:48:45Z)
Privacy Protection in Personalized Diffusion Models via Targeted Cross-Attention Adversarial Attack [5.357486699062561]
本稿では,CoPSAM(Selective Attention Manipulation)による新規かつ効率的な対向攻撃法を提案する。この目的のために、クリーンなサンプルに付加される知覚不可能なノイズを慎重に構築し、その逆のノイズを得る。 CelebA-HQ顔画像データセットのサブセットに対する実験的検証は、我々のアプローチが既存の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-11-25T14:39:18Z)
Diffusion-RPO: Aligning Diffusion Models through Relative Preference Optimization [68.69203905664524]
拡散に基づくT2Iモデルと人間の嗜好をより効率的に整合させる新しい手法であるDiffusion-RPOを紹介する。我々は,高いコストと低い解釈可能性の課題を克服することを目的とした,新しい評価基準であるスタイルアライメントを開発した。その結果,拡散-RPO は安定拡散バージョン1.5 と XL-1.0 の調整において超微調整や拡散-DPO などの確立された手法よりも優れていた。
論文参考訳（メタデータ） (2024-06-10T15:42:03Z)
Direct Consistency Optimization for Compositional Text-to-Image Personalization [73.94505688626651]
テキスト・ツー・イメージ(T2I)拡散モデルは、いくつかの個人画像に微調整された場合、高い一貫性で視覚を生成することができる。本稿では,参照画像との整合性を最大化しつつ,事前学習したモデルからの偏差を補償することにより,T2Iモデルを微調整する。
論文参考訳（メタデータ） (2024-02-19T09:52:41Z)
Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文参考訳（メタデータ） (2023-12-22T14:40:55Z)
Separate-and-Enhance: Compositional Finetuning for Text2Image Diffusion Models [58.46926334842161]
この研究は、注意力の低いアクティベーションスコアとマスクオーバーラップに関連する問題を指摘し、このような不一致の根本的な理由を照らしている。本稿では,物体マスクの重なりを低減し,注目度を最大化する2つの新しい目的,分離損失とエンハンス損失を提案する。提案手法は従来のテスト時間適応手法と異なり,拡張性と一般化性を高める重要なパラメータの微調整に重点を置いている。
論文参考訳（メタデータ） (2023-12-10T22:07:42Z)
Beyond First-Order Tweedie: Solving Inverse Problems using Latent Diffusion [41.758635460235716]
我々はSurrogate Loss (STSL) の2階Tweedieサンプルについて紹介する。 STSLは、二階近似を用いたトラクタブル・リバース・プロセスを備えた一階Tweedieに匹敵する効率性を提供する。提案手法は,PSLDとP2Lを超越し,神経機能評価の4倍,8倍の低減を実現した。
論文参考訳（メタデータ） (2023-12-01T14:36:24Z)
Debiasing the Cloze Task in Sequential Recommendation with Bidirectional Transformers [0.0]
Inverse Propensity Scoring (IPS) は、問題の時間的性質を考慮しないため、逐次的なレコメンデーションに拡張されない。そこで我々は,Clozeタスクの逐次的推奨を理論的に無視できる新しい確率スコアリング機構を提案する。
論文参考訳（メタデータ） (2023-01-22T21:44:25Z)
Improving Crowded Object Detection via Copy-Paste [6.941267349187447]
類似した物体同士の重なり合いによって引き起こされる群集性は、2次元視覚的物体検出の分野においてユビキタスな課題である。 1) IoU-confidence correlation disturbances (ICD) と 2) confused de-duplication (CDD) の2つの主な効果について述べる。
論文参考訳（メタデータ） (2022-11-22T09:25:15Z)
Bias-Robust Bayesian Optimization via Dueling Bandit [57.82422045437126]
ベイジアン最適化は、観測が逆偏りとなるような環境において考慮する。情報指向サンプリング(IDS)に基づくダリングバンディットの新しい手法を提案する。これにより、累積的後悔保証を伴う帯域幅の並列化のための、最初の効率的なカーネル化アルゴリズムが得られる。
論文参考訳（メタデータ） (2021-05-25T10:08:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。