論文の概要: DETONATE: A Benchmark for Text-to-Image Alignment and Kernelized Direct Preference Optimization
- arxiv url: http://arxiv.org/abs/2506.14903v1
- Date: Tue, 17 Jun 2025 18:17:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.448924
- Title: DETONATE: A Benchmark for Text-to-Image Alignment and Kernelized Direct Preference Optimization
- Title(参考訳): DETONATE: テキストと画像のアライメントとカーネルによる直接参照最適化のためのベンチマーク
- Authors: Renjith Prasad, Abhilekh Borah, Hasnat Md Abdullah, Chathurangi Shyalika, Gurpreet Singh, Ritvik Garimella, Rajarshi Roy, Harshul Surana, Nasrin Imanpour, Suranjana Trivedy, Amit Sheth, Amitava Das,
- Abstract要約: 本稿では,テキスト・トゥ・イメージ(T2I)モデルのためのDPOカーネルについて紹介する。
約100Kのキュレートされた画像対からなる,最初の大規模ベンチマークであるDETONATEを紹介する。
また,アライメント品質指数 (AQI) も提案する。これは,安全かつ安全でない画像のアクティベーションの潜在空間分離性を示す新しい幾何学的尺度である。
- 参考スコア(独自算出の注目度): 4.496316647545223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Alignment is crucial for text-to-image (T2I) models to ensure that generated images faithfully capture user intent while maintaining safety and fairness. Direct Preference Optimization (DPO), prominent in large language models (LLMs), is extending its influence to T2I systems. This paper introduces DPO-Kernels for T2I models, a novel extension enhancing alignment across three dimensions: (i) Hybrid Loss, integrating embedding-based objectives with traditional probability-based loss for improved optimization; (ii) Kernelized Representations, employing Radial Basis Function (RBF), Polynomial, and Wavelet kernels for richer feature transformations and better separation between safe and unsafe inputs; and (iii) Divergence Selection, expanding beyond DPO's default Kullback-Leibler (KL) regularizer by incorporating Wasserstein and R'enyi divergences for enhanced stability and robustness. We introduce DETONATE, the first large-scale benchmark of its kind, comprising approximately 100K curated image pairs categorized as chosen and rejected. DETONATE encapsulates three axes of social bias and discrimination: Race, Gender, and Disability. Prompts are sourced from hate speech datasets, with images generated by leading T2I models including Stable Diffusion 3.5 Large, Stable Diffusion XL, and Midjourney. Additionally, we propose the Alignment Quality Index (AQI), a novel geometric measure quantifying latent-space separability of safe/unsafe image activations, revealing hidden vulnerabilities. Empirically, we demonstrate that DPO-Kernels maintain strong generalization bounds via Heavy-Tailed Self-Regularization (HT-SR). DETONATE and complete code are publicly released.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)モデルではアライメントが重要であり、生成した画像が安全性と公正性を保ちながらユーザの意図を忠実に捉えている。
大規模言語モデル(LLM)で顕著なDPO(Direct Preference Optimization)は、T2Iシステムにその影響を拡大している。
本稿では,T2IモデルのDPO-Kernelsについて紹介する。
(i) 最適化を改善するため、埋め込みに基づく目的と従来の確率に基づく損失を統合するハイブリッド損失
(II)よりリッチな特徴変換と安全な入力と安全でない入力の分離のために、RAF(Radial Basis Function)、Polynomial、Waveletカーネルを使用したカーネル化表現
3) DPOのデフォルトのクルバック・リーブラー(KL)正則化器を超えて、安定性と堅牢性を高めるためにワッサーシュタインとR'enyiの発散器を組み込むことにより、ダイバージェンス選択を行う。
我々は,このタイプの最初の大規模ベンチマークであるDETONATEを紹介し,約100Kのキュレートされた画像対を選択・拒否した。
DETONATEは、人種、ジェンダー、障害という、社会的偏見と差別の3つの軸をカプセル化している。
プロンプトはヘイトスピーチデータセットから作成されており、Stable Diffusion 3.5 Large、Stable Diffusion XL、Midjourneyといった主要なT2Iモデルによって生成される。
さらに,安全な画像アクティベーションの遅延空間分離性を定量化し,隠れた脆弱性を明らかにする新しい幾何学的指標であるアライメント品質指標(AQI)を提案する。
経験的に、DPO-Kernels がヘビータイド自己正則化 (HT-SR) を介して強い一般化境界を維持していることを示す。
DETONATEと完全なコードは公開されている。
関連論文リスト
- FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - YINYANG-ALIGN: Benchmarking Contradictory Objectives and Proposing Multi-Objective Optimization based DPO for Text-to-Image Alignment [6.120756739633247]
YinYangAlignは、テキスト・トゥ・イメージ(T2I)システムのアライメント忠実度を体系的に定量化するフレームワークである。
6つの基本的かつ本質的に矛盾する設計目標に対処する。
YinYangAlignには、人間のプロンプト、アライメントされた(コセン)応答、AI生成出力のミスアライメント(拒絶)、根底にある矛盾の説明を含む詳細なデータセットが含まれている。
論文 参考訳(メタデータ) (2025-02-05T18:46:20Z) - DPO Kernels: A Semantically-Aware, Kernel-Enhanced, and Divergence-Rich Paradigm for Direct Preference Optimization [6.303144414273044]
大規模言語モデル(LLM)は、多くのアプリケーションをアンロックしただけでなく、様々な値や好みと整合させることの難しさも浮き彫りにしている。
直接選好最適化(DPO)は、アライメントの中心であるが、固定された発散と限られた特徴変換によって制約される。
論文 参考訳(メタデータ) (2025-01-05T00:08:52Z) - SafetyDPO: Scalable Safety Alignment for Text-to-Image Generation [68.07258248467309]
テキスト・ツー・イメージ(T2I)モデルは広く普及しているが、その限られた安全ガードレールはエンドユーザを有害なコンテンツに晒し、モデル誤用を許容する可能性がある。
現在の安全対策はテキストベースのフィルタリングや概念除去戦略に限られており、モデルの生成能力からわずかに概念を除去することができる。
直接選好最適化(DPO)によるT2Iモデルの安全アライメント手法であるSafetyDPOを導入する。
我々は、ローランク適応(LoRA)行列の形で、特定の安全関連から生成プロセスを導くことができる安全専門家を訓練する。
論文 参考訳(メタデータ) (2024-12-13T18:59:52Z) - Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.07634676709067]
本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文 参考訳(メタデータ) (2023-08-19T05:34:13Z) - A Generalized Kernel Risk Sensitive Loss for Robust Two-Dimensional
Singular Value Decomposition [11.234115388848283]
2次元特異分解(2DSVD)は、画像再構成、分類、クラスタリングなどの画像処理タスクに広く用いられている。
従来の2DSVDは平均二乗誤差(MSE)損失に基づいており、これは外れ値に敏感である。
本稿では,雑音と外乱の一般化されたカーネルリスクに基づくロバストDSVDを提案する。
論文 参考訳(メタデータ) (2020-05-10T14:02:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。