論文の概要: Localizing Memorized Regions in Diffusion Models via Coordinate-Wise Curvature Differences
- arxiv url: http://arxiv.org/abs/2605.26756v2
- Date: Thu, 28 May 2026 16:35:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:54.740082
- Title: Localizing Memorized Regions in Diffusion Models via Coordinate-Wise Curvature Differences
- Title(参考訳): コーディネート・ワイズ曲率差による拡散モデルの局所記憶領域
- Authors: Gwangho Kim, Sungyoon Lee,
- Abstract要約: 拡散モデルは、意図せずトレーニングサンプルを記憶し、プライバシと著作権に関する懸念を提起する。
局所記憶の幾何的特徴は座標方向の分散崩壊である。
我々は、広く使われているスコア差検出指標の幾何学的説明を提供するスコア差検出プロキシを導出する。
- 参考スコア(独自算出の注目度): 7.519872646378835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models can unintentionally memorize training samples, raising concerns about privacy and copyright. While recent methods can detect memorization, they often rely on global or model-specific signals and provide limited insight into where memorization appears within a generated image. We provide a geometric characterization of local memorization as a coordinate-wise variance collapse. However, such collapse can also arise from intrinsic data constraints rather than overfitting. To isolate overfitting-driven memorization, we propose curvature-difference methods that subtract the curvature of an underfitted baseline, either the unconditional model or a less-trained version of itself. We further derive a score-difference proxy that provides a geometric explanation for the widely used score-difference-based detection metric. Experiments on Stable Diffusion, evaluated against ground-truth memorization masks, show that our method outperforms the prior attention-based localization method. Code is available at https://github.com/Gwangho99/mem-curv-diff.
- Abstract(参考訳): 拡散モデルは、意図せずトレーニングサンプルを記憶し、プライバシと著作権に関する懸念を提起する。
近年の手法では暗記を検出することができるが、大域的信号やモデル固有の信号に頼り、生成された画像の中で暗記がどこに現れるかという限られた洞察を与えることが多い。
局所記憶の幾何的特徴は座標方向の分散崩壊である。
しかし、そのような崩壊は、過度に適合するのではなく、本質的なデータ制約によっても起こりうる。
オーバーフィッティング駆動の暗記を分離するために,未適合なベースラインの曲率を減じる曲率差分法を提案する。
さらに、広く使われているスコア差検出指標の幾何学的説明を提供するスコア差検出プロキシを導出する。
安定拡散実験は, 地表面の暗記マスクに対して評価され, 従来のアテンションに基づく位置推定法よりも優れていた。
コードはhttps://github.com/Gwangho99/mem-curv-diffで入手できる。
関連論文リスト
- Characterizing Memorization in Diffusion Language Models: Generalized Extraction and Sampling Effects [17.220195638215507]
拡散言語モデル (DLMs) は自己回帰言語モデル (ARMs) の代替として登場した。
DLMは、ARMと比較して、個人識別情報(PII)の記憶に基づくリークが著しく低い。
論文 参考訳(メタデータ) (2026-03-02T19:03:32Z) - Detecting and Mitigating Memorization in Diffusion Models through Anisotropy of the Log-Probability [9.133729396364952]
拡散に基づく画像生成モデルは、反復的復調によって高忠実度画像を生成するが、記憶に弱いままである。
最近の暗記検出法は主に暗記の指標としてスコア差のノルムに基づいている。
等方性ノルムと異方性アライメントを統合することで,記憶度検出尺度を開発した。
論文 参考訳(メタデータ) (2026-01-28T14:29:42Z) - Provable Separations between Memorization and Generalization in Diffusion Models [31.32606216124959]
我々は,統計的推定とネットワーク近似による二分割結果を開発した。
本研究は, 基礎構造スコア関数が経験的復調損失を最小限に抑えられず, 暗記を駆動する分離を生じさせることを示す。
論文 参考訳(メタデータ) (2025-11-05T05:37:57Z) - Calibrating Biased Distribution in VFM-derived Latent Space via Cross-Domain Geometric Consistency [52.52950138164424]
特徴抽出にオフザシェルフ(ビジョン)基礎モデルを利用する場合、特徴分布の幾何学的形状はドメインやデータセット間で顕著な伝達性を示す。
我々は,我々の幾何学的知識誘導分布キャリブレーションフレームワークを,フェデレーション学習とロングテール認識の2つの人気かつ挑戦的な設定で具体化する。
長期学習において、サンプル豊富なカテゴリから移動された幾何学的知識を利用して、サンプル・スカース・テールクラスの真の分布を復元する。
論文 参考訳(メタデータ) (2025-08-19T05:22:59Z) - Demystifying Foreground-Background Memorization in Diffusion Models [23.914702151370204]
拡散モデル(DM)はトレーニング画像を記憶し、生成中にほぼ重複を再現することができる。
現在の検出法は動詞の暗記を識別するが、2つの重要な側面を捉えることができない。
生成した画像内の記憶領域を分類・定量化するセグメンテーションに基づく新しい指標であるフォアグラウンド背景記憶法(FB-Mem)を提案する。
論文 参考訳(メタデータ) (2025-08-16T20:15:16Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Unsupervised Discovery of Interpretable Directions in h-space of
Pre-trained Diffusion Models [63.1637853118899]
本稿では,事前学習した拡散モデルのh空間における解釈可能な方向を特定するための,教師なしおよび学習に基づく最初の手法を提案する。
我々は、事前訓練された拡散モデルのh-スペースで動作するシフト制御モジュールを用いて、サンプルをシフトしたバージョンに操作する。
それらを共同で最適化することで、モデルは自然に絡み合った、解釈可能な方向を発見する。
論文 参考訳(メタデータ) (2023-10-15T18:44:30Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。