Fugu-MT 論文翻訳(概要): Could It Be Generated? Towards Practical Analysis of Memorization in Text-To-Image Diffusion Models

論文の概要: Could It Be Generated? Towards Practical Analysis of Memorization in Text-To-Image Diffusion Models

arxiv url: http://arxiv.org/abs/2405.05846v1
Date: Thu, 9 May 2024 15:32:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-10 12:53:04.777306
Title: Could It Be Generated? Towards Practical Analysis of Memorization in Text-To-Image Diffusion Models
Title（参考訳）: 生成可能か? : テキスト・画像拡散モデルにおける記憶の実践的分析に向けて
Authors: Zhe Ma, Xuhong Zhang, Qingming Li, Tianyu Du, Wenzhi Chen, Zonghui Wang, Shouling Ji,
Abstract要約: テキスト・画像拡散モデルにおける記憶の実際的解析を行う。暗記に必要な3つの条件,それぞれ類似性,存在,および確率を同定する。次に,モデルの予測誤差と画像複製の相関関係を明らかにする。
参考スコア（独自算出の注目度）: 39.607005089747936
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The past few years have witnessed substantial advancement in text-guided image generation powered by diffusion models. However, it was shown that text-to-image diffusion models are vulnerable to training image memorization, raising concerns on copyright infringement and privacy invasion. In this work, we perform practical analysis of memorization in text-to-image diffusion models. Targeting a set of images to protect, we conduct quantitive analysis on them without need to collect any prompts. Specifically, we first formally define the memorization of image and identify three necessary conditions of memorization, respectively similarity, existence and probability. We then reveal the correlation between the model's prediction error and image replication. Based on the correlation, we propose to utilize inversion techniques to verify the safety of target images against memorization and measure the extent to which they are memorized. Model developers can utilize our analysis method to discover memorized images or reliably claim safety against memorization. Extensive experiments on the Stable Diffusion, a popular open-source text-to-image diffusion model, demonstrate the effectiveness of our analysis method.
Abstract（参考訳）: 過去数年間、拡散モデルを利用したテキスト誘導画像生成の大幅な進歩が見られた。しかし,テキスト・画像拡散モデルは画像記憶の訓練に脆弱であり,著作権侵害やプライバシー侵害への懸念が高まっている。本研究では,テキスト・画像拡散モデルにおける記憶の実際的解析を行う。保護するイメージのセットをターゲットとして,プロンプトの収集を必要とせず,定量分析を行う。具体的には、まず画像の記憶を正式に定義し、それぞれ類似性、存在、および確率の3つの必要な記憶条件を特定する。次に,モデルの予測誤差と画像複製の相関関係を明らかにする。相関関係に基づいて,対象画像の暗記に対する安全性を検証し,その暗記範囲を計測するための逆解析手法を提案する。モデル開発者は、我々の分析手法を利用して記憶された画像を発見したり、記憶に対する安全性を確実に主張することができる。オープンソーステキスト・画像拡散モデルであるStable Diffusionの大規模な実験により,解析手法の有効性が実証された。

関連論文リスト

What is Adversarial Training for Diffusion Models? [4.71482540145286]
拡散モデル(DM)に対する対戦訓練(AT)は,分類器と根本的に異なることを示す。 ATは拡散流の滑らかさを強制し、異常値と破損したデータを改善する方法である。我々は,低次元および高次元空間における既知の分布を持つ概念実証データセットを用いて,我々のアプローチを厳密に評価する。
論文参考訳（メタデータ） (2025-05-27T20:32:28Z)
Spatial Reasoning with Denoising Models [49.83744014336816]
本稿では,連続変数の集合に対する推論を行うためのフレームワークを提案する。初めて、その生成順序をデノナイジングネットワーク自体によって予測できる。これらの結果から,特定の推論タスクの精度を1%から50%に向上させることができる。
論文参考訳（メタデータ） (2025-02-28T14:08:30Z)
Redistribute Ensemble Training for Mitigating Memorization in Diffusion Models [31.92526915009259]
拡散モデルは非常に高品質なサンプルを生成する能力で知られている。最近のメモリ緩和法は、主にテキストモダリティの文脈における問題に対処している。本稿では,視覚的モダリティの観点からの拡散モデルの新たな手法を提案する。
論文参考訳（メタデータ） (2025-02-13T15:56:44Z)
Investigating Memorization in Video Diffusion Models [58.70363256771246]
画像生成やビデオ生成に広く用いられている拡散モデルは、推論中にトレーニングデータを記憶し再生するリスクという、重大な制限に直面している。まず,VDM(Content memorization and Motion memorization)の2種類の記憶を現実的に定義する。次に、VDMにおけるコンテンツと動きの記憶を別々に評価するために特別に設計された新しい指標を導入する。
論文参考訳（メタデータ） (2024-10-29T02:34:06Z)
Learning Diffusion Model from Noisy Measurement using Principled Expectation-Maximization Method [9.173055778539641]
本稿では,任意の破損型を持つ雑音データから拡散モデルを反復的に学習する,原則的予測最大化(EM)フレームワークを提案する。筆者らはモンテカルロ法を用いて,ノイズ測定からクリーンな画像を正確に推定し,次いで再構成画像を用いて拡散モデルを訓練した。
論文参考訳（メタデータ） (2024-10-15T03:54:59Z)
Detecting, Explaining, and Mitigating Memorization in Diffusion Models [49.438362005962375]
そこで本研究では,テキスト条件予測の大きさを検査することで,暗黙のプロンプトを検出する方法を提案する。提案手法はサンプリングアルゴリズムを中断することなくシームレスに統合し,第1世代でも高い精度を実現する。検出戦略に基づいて,個々の単語やトークンの記憶への寄与を示す説明可能なアプローチを提示する。
論文参考訳（メタデータ） (2024-07-31T16:13:29Z)
MemBench: Memorized Image Trigger Prompt Dataset for Diffusion Models [28.64962324938148]
本稿では,画像記憶の緩和手法を評価するための最初のベンチマークであるMemBenchを紹介する。本稿では,トリガープロンプトと一般プロンプトの両方で評価された指標について述べる。
論文参考訳（メタデータ） (2024-07-24T08:46:58Z)
Unveiling Structural Memorization: Structural Membership Inference Attack for Text-to-Image Diffusion Models [17.946671657675022]
メンバー推論攻撃(MIA)は、プライバシ保護のためのツールとして機能するよう提案されている。テキストから画像への拡散モデルに適した,シンプルで効果的なMIA手法を提案する。我々の手法は、最先端の性能を達成するだけでなく、様々な歪みに対して顕著な堅牢性を示す。
論文参考訳（メタデータ） (2024-07-18T08:07:28Z)
Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文参考訳（メタデータ） (2024-06-18T16:20:12Z)
Memorized Images in Diffusion Models share a Subspace that can be Located and Deleted [15.162296378581853]
大規模テキスト・画像拡散モデルはテキスト入力から高品質な画像を生成するのに優れている。研究は、トレーニングデータを記憶し複製する傾向を示すため、懸念が生じる。データ重複、複製されたキャプション、トークンのトリガーなどの原因を探る。
論文参考訳（メタデータ） (2024-06-01T15:47:13Z)
Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy [36.156856772794065]
テキスト・画像拡散モデルにおける条件付きオーバーフィッティング現象を提案する。提案手法は, 各種データおよびデータセットのスケールにおいて, 従来手法よりも大幅に優れていた。
論文参考訳（メタデータ） (2024-05-23T17:09:51Z)
ReNoise: Real Image Inversion Through Iterative Noising [62.96073631599749]
本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文参考訳（メタデータ） (2024-03-21T17:52:08Z)
Consistent Diffusion Meets Tweedie: Training Exact Ambient Diffusion Models with Noisy Data [74.2507346810066]
アンビエント拡散(アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散本稿では,ノイズの多い学習データのみを考慮し,故障のない分布から確実にサンプルを採取する拡散モデルのトレーニングのための最初のフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-20T14:22:12Z)
Unveiling and Mitigating Memorization in Text-to-image Diffusion Models through Cross Attention [62.671435607043875]
研究は、テキストから画像への拡散モデルがトレーニングデータから画像を複製し、著作権侵害やプライバシーのリスクに対する大きな懸念を引き起こすことを示唆している。暗記中、クロスアテンションは特定のトークンの埋め込みに不均等に集中する傾向にあることが明らかとなった。拡散モデルにおける記憶の検出と緩和のための革新的なアプローチを導入する。
論文参考訳（メタデータ） (2024-03-17T01:27:00Z)
On Memorization in Diffusion Models [44.031805633114985]
より小さなデータセットでは記憶の挙動が生じる傾向があることを示す。我々は、有効モデル記憶(EMM)の観点から、影響因子がこれらの記憶行動に与える影響を定量化する。本研究は,拡散モデル利用者にとって実用的意義を持ち,深部生成モデルの理論研究の手がかりを提供する。
論文参考訳（メタデータ） (2023-10-04T09:04:20Z)
DIAGNOSIS: Detecting Unauthorized Data Usages in Text-to-image Diffusion Models [79.71665540122498]
保護されたデータセットにインジェクトされたコンテンツを配置することで、不正なデータ利用を検出する手法を提案する。具体的には、ステルス画像ワープ機能を用いて、これらの画像にユニークな内容を追加することにより、保護された画像を修正する。このモデルが注入されたコンテンツを記憶したかどうかを解析することにより、不正に不正に使用したモデルを検出することができる。
論文参考訳（メタデータ） (2023-07-06T16:27:39Z)
Understanding and Mitigating Copying in Diffusion Models [53.03978584040557]
安定拡散のような拡散モデルによって生成される画像は、ますます広まっている。最近の研究や訴訟でも、これらのモデルがトレーニングデータを複製する傾向にあることが示されている。
論文参考訳（メタデータ） (2023-05-31T17:58:02Z)
Discffusion: Discriminative Diffusion Models as Few-shot Vision and Language Learners [88.07317175639226]
本稿では,事前学習したテキストと画像の拡散モデルを数ショットの識別学習者に変換する新しい手法,DSDを提案する。本手法は, 安定拡散モデルにおいて, 視覚情報とテキスト情報の相互影響を捉えるために, クロスアテンションスコアを用いている。
論文参考訳（メタデータ） (2023-05-18T05:41:36Z)
Trust but Verify: Assigning Prediction Credibility by Counterfactual Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文参考訳（メタデータ） (2020-11-24T19:52:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。