Fugu-MT 論文翻訳(概要): Unlocking Intrinsic Fairness in Stable Diffusion

論文の概要: Unlocking Intrinsic Fairness in Stable Diffusion

arxiv url: http://arxiv.org/abs/2408.12692v1
Date: Thu, 22 Aug 2024 19:12:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-26 16:48:16.002676
Title: Unlocking Intrinsic Fairness in Stable Diffusion
Title（参考訳）: 安定拡散における固有値のアンロック
Authors: Eunji Kim, Siwon Kim, Rahim Entezari, Sungroh Yoon,
Abstract要約: 安定拡散は本質的に公平性を持ち、不偏出力を達成するためにアンロックできることが示される。本稿では,安定拡散の本質的公正性を解き放つために,テキスト条件を乱す新しい手法を提案する。本手法は,画像テキストのアライメントと画質を保ちながら,追加チューニングなしでバイアスを効果的に軽減する。
参考スコア（独自算出の注目度）: 42.746722760353414
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent text-to-image models like Stable Diffusion produce photo-realistic images but often show demographic biases. Previous debiasing methods focused on training-based approaches, failing to explore the root causes of bias and overlooking Stable Diffusion's potential for unbiased image generation. In this paper, we demonstrate that Stable Diffusion inherently possesses fairness, which can be unlocked to achieve debiased outputs. Through carefully designed experiments, we identify the excessive bonding between text prompts and the diffusion process as a key source of bias. To address this, we propose a novel approach that perturbs text conditions to unleash Stable Diffusion's intrinsic fairness. Our method effectively mitigates bias without additional tuning, while preserving image-text alignment and image quality.
Abstract（参考訳）: 近年のStable Diffusionのようなテキストと画像のモデルでは、フォトリアリスティックなイメージを生成するが、しばしば人口統計学的バイアスを示す。以前のデバイアス法はトレーニングベースのアプローチに重点を置いていたが、バイアスの根本原因を探索できず、安定拡散の非バイアス画像生成の可能性を見落としていた。本稿では,安定拡散が本質的に公平性を持っていることを実証する。慎重に設計された実験を通して、テキストプロンプトと拡散過程との過剰な結合をバイアスの鍵源として同定する。そこで本研究では,安定拡散の本質的公正性を解き放つために,テキスト条件を乱す新しい手法を提案する。本手法は,画像テキストのアライメントと画質を保ちながら,追加チューニングなしでバイアスを効果的に軽減する。

関連論文リスト

Improved Immiscible Diffusion: Accelerate Diffusion Training by Reducing Its Miscibility [62.272571285823595]
不和がいかに軽視し、効率を向上するかを示す。そこで本稿では,K-nearest neighbor (KNN) ノイズ選択や画像スケーリングなどの実装のファミリを提案する。この研究は、今後の高効率拡散訓練研究の新たな方向性を確立する。
論文参考訳（メタデータ） (2025-05-24T05:38:35Z)
Deeper Diffusion Models Amplify Bias [46.2410852276839]
拡散モデルはトレーニングデータに固有のバイアスを増幅する。また、トレーニングサンプルの予想されるプライバシーを侵害する可能性がある。テキスト・ツー・イメージ生成と画像・画像生成における出力品質を改善するためのトレーニング不要な手法を提案する。
論文参考訳（メタデータ） (2025-05-23T07:08:09Z)
ALBAR: Adversarial Learning approach to mitigate Biases in Action Recognition [52.537021302246664]
行動認識モデルは、しばしば背景バイアス(背景の手がかりに基づく行動の推測)と前景バイアス(主題の外観に依存する)に悩まされる。本稿では,前景や背景のバイアスを,バイアス特性の専門知識を必要とせずに軽減する,新たな対人訓練手法であるALBARを提案する。我々は,提案手法を確立された背景と前景のバイアスプロトコル上で評価し,新しい最先端のバイアスプロトコルを設定し,HMDB51では12%以上のデバイアス性能を向上した。
論文参考訳（メタデータ） (2025-01-31T20:47:06Z)
INDIGO+: A Unified INN-Guided Probabilistic Diffusion Algorithm for Blind and Non-Blind Image Restoration [22.19661915697775]
非盲点画像復元のための新しい INN 誘導確率拡散アルゴリズムを提案する。 INDIGOとBlindINDIGOは、非可逆ニューラルネットワーク(INN)の完全な再構成特性と、事前訓練された拡散モデルの強力な生成能力の利点を組み合わせている。
論文参考訳（メタデータ） (2025-01-23T18:51:52Z)
Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文参考訳（メタデータ） (2024-10-04T01:52:23Z)
Adversarial Robustification via Text-to-Image Diffusion Models [56.37291240867549]
アドリラルロバスト性は、ニューラルネットワークをエンコードする難しい性質として伝統的に信じられてきた。データを使わずに敵の堅牢性を実現するために,スケーラブルでモデルに依存しないソリューションを開発した。
論文参考訳（メタデータ） (2024-07-26T10:49:14Z)
When Text and Images Don't Mix: Bias-Correcting Language-Image Similarity Scores for Anomaly Detection [35.09035417676343]
テキスト入力の埋め込みは、モデルの対照的な訓練目標とは対照的に、画像埋め込みから遠ざかって、予期せず密集していることを示す。本稿では,この類似性バイアスを補助的,外部的なテキスト入力を用いて直接考慮するBLISSという手法を提案する。
論文参考訳（メタデータ） (2024-07-24T08:20:02Z)
Latent Directions: A Simple Pathway to Bias Mitigation in Generative AI [45.54709270833219]
生成的AIにおけるバイアスの緩和、特にテキスト・ツー・イメージのモデルは、社会にその影響が拡大していることを考えると、非常に重要である。本研究は,潜在空間の方向を学習することで,多種多様な包摂的合成画像を実現するための新しいアプローチを提案する。これらの学習された遅延方向を線形に組み合わせて、新しい緩和を導入し、望めばテキスト埋め込み調整と統合することができる。
論文参考訳（メタデータ） (2024-06-10T15:13:51Z)
Text Diffusion with Reinforced Conditioning [92.17397504834825]
本稿では,テキスト拡散モデルを完全に解析し,トレーニング中の自己条件の劣化と,トレーニングとサンプリングのミスアライメントの2つの重要な限界を明らかにする。そこで本研究では, TRECと呼ばれる新しいテキスト拡散モデルを提案する。
論文参考訳（メタデータ） (2024-02-19T09:24:02Z)
Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models [82.8261101680427]
滑らかな潜伏空間は、入力潜伏空間上の摂動が出力画像の定常的な変化に対応することを保証している。この特性は、画像の反転、反転、編集を含む下流タスクにおいて有益である。スムース拡散(Smooth Diffusion, Smooth Diffusion)は, 高速かつスムーズな拡散モデルである。
論文参考訳（メタデータ） (2023-12-07T16:26:23Z)
Fair Text-to-Image Diffusion via Fair Mapping [32.02815667307623]
本稿では,事前学習したテキスト・画像拡散モデルを修正する,フレキシブルでモデルに依存しない,軽量なアプローチを提案する。暗黙的言語バイアスの問題を効果的に解決することにより、より公平で多様な画像出力を生成する。
論文参考訳（メタデータ） (2023-11-29T15:02:01Z)
Manifold Preserving Guided Diffusion [121.97907811212123]
条件付き画像生成は、コスト、一般化可能性、タスク固有のトレーニングの必要性といった課題に直面している。トレーニング不要な条件生成フレームワークであるManifold Preserving Guided Diffusion (MPGD)を提案する。
論文参考訳（メタデータ） (2023-11-28T02:08:06Z)
Unmasking Bias in Diffusion Model Training [40.90066994983719]
拡散モデルが画像生成の主流のアプローチとして登場した。トレーニングの収束が遅く、サンプリングのカラーシフトの問題に悩まされている。本稿では,これらの障害は,既定のトレーニングパラダイムに固有のバイアスや準最適性に大きく起因していると考えられる。
論文参考訳（メタデータ） (2023-10-12T16:04:41Z)
MaskDiffusion: Boosting Text-to-Image Consistency with Conditional Mask [84.84034179136458]
テキスト・イメージのミスマッチ問題に繋がる重要な要因は、モダリティ間の関係学習の不十分さである。本稿では,注目マップと迅速な埋め込みを条件とした適応マスクを提案し,画像特徴に対する各テキストトークンの寄与度を動的に調整する。この手法はMaskDiffusionと呼ばれ、トレーニング不要で、一般的な事前学習拡散モデルに対してホットプラグ可能である。
論文参考訳（メタデータ） (2023-09-08T15:53:37Z)
Fuzzy-Conditioned Diffusion and Diffusion Projection Attention Applied to Facial Image Correction [14.34815548338413]
我々は、暗黙の拡散先行を制御可能な強度で活用できるファジィ条件拡散を導出する。本稿では,ファジィ条件の拡散と拡散依存性の注意マップを組み合わせた顔画像補正手法を提案する。
論文参考訳（メタデータ） (2023-06-26T17:58:00Z)
Deceptive-NeRF/3DGS: Diffusion-Generated Pseudo-Observations for High-Quality Sparse-View Reconstruction [60.52716381465063]
我々は,限られた入力画像のみを用いて,スパースビュー再構成を改善するために,Deceptive-NeRF/3DGSを導入した。具体的には,少数視点再構成によるノイズ画像から高品質な擬似観測へ変換する,偽拡散モデルを提案する。本システムでは,拡散生成擬似観測をトレーニング画像集合に徐々に組み込んで,スパース入力観測を5倍から10倍に高めている。
論文参考訳（メタデータ） (2023-05-24T14:00:32Z)
Discffusion: Discriminative Diffusion Models as Few-shot Vision and Language Learners [88.07317175639226]
本稿では,事前学習したテキストと画像の拡散モデルを数ショットの識別学習者に変換する新しい手法,DSDを提案する。本手法は, 安定拡散モデルにおいて, 視覚情報とテキスト情報の相互影響を捉えるために, クロスアテンションスコアを用いている。
論文参考訳（メタデータ） (2023-05-18T05:41:36Z)
Your Diffusion Model is Secretly a Zero-Shot Classifier [90.40799216880342]
大規模テキスト・画像拡散モデルからの密度推定をゼロショット分類に活用できることを示す。分類に対する我々の生成的アプローチは、様々なベンチマークで強い結果が得られる。我々の結果は、下流タスクにおける差別的モデルよりも生成的な利用に向けての一歩である。
論文参考訳（メタデータ） (2023-03-28T17:59:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。