Fugu-MT 論文翻訳(概要): Data Attribution for Text-to-Image Models by Unlearning Synthesized Images

論文の概要: Data Attribution for Text-to-Image Models by Unlearning Synthesized Images

arxiv url: http://arxiv.org/abs/2406.09408v2
Date: Mon, 09 Dec 2024 18:58:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-10 23:11:43.591619
Title: Data Attribution for Text-to-Image Models by Unlearning Synthesized Images
Title（参考訳）: 非学習型合成画像によるテキスト・画像モデルのデータの属性
Authors: Sheng-Yu Wang, Aaron Hertzmann, Alexei A. Efros, Jun-Yan Zhu, Richard Zhang,
Abstract要約: テキスト・ツー・イメージ・モデルにおけるデータ帰属の目標は、新しい画像の生成に最も影響を与えるトレーニング画像を特定することである。合成画像の非学習をシミュレートして効率的なデータ帰属法を提案する。次に,学習過程の終了後に有意な損失偏差を伴う訓練画像を特定し,これらを影響力のあるものとしてラベル付けする。
参考スコア（独自算出の注目度）: 71.23012718682634
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: The goal of data attribution for text-to-image models is to identify the training images that most influence the generation of a new image. Influence is defined such that, for a given output, if a model is retrained from scratch without the most influential images, the model would fail to reproduce the same output. Unfortunately, directly searching for these influential images is computationally infeasible, since it would require repeatedly retraining models from scratch. In our work, we propose an efficient data attribution method by simulating unlearning the synthesized image. We achieve this by increasing the training loss on the output image, without catastrophic forgetting of other, unrelated concepts. We then identify training images with significant loss deviations after the unlearning process and label these as influential. We evaluate our method with a computationally intensive but "gold-standard" retraining from scratch and demonstrate our method's advantages over previous methods.
Abstract（参考訳）: テキスト・ツー・イメージ・モデルにおけるデータ帰属の目標は、新しい画像の生成に最も影響を与えるトレーニング画像を特定することである。影響は、与えられた出力に対して、最も影響力のある画像なしでモデルがゼロから再訓練された場合、モデルが同じ出力を再生できないように定義される。残念ながら、これらの影響のある画像を直接検索することは、スクラッチから繰り返しモデルを再訓練する必要があるため、計算不可能である。本研究では,合成画像の非学習をシミュレートし,効率的なデータ帰属手法を提案する。我々は、他の無関係な概念を破滅的に忘れることなく、出力画像のトレーニング損失を増大させることで、これを実現する。次に,学習過程の終了後に有意な損失偏差を伴う訓練画像を特定し,これらを影響力のあるものとしてラベル付けする。計算量が多いが,スクラッチからの「ゴールドスタンダード」再トレーニングにより評価し,従来の手法に比べて,本手法の利点を実証した。

関連論文リスト

Model Integrity when Unlearning with T2I Diffusion Models [11.321968363411145]
「忘れ分布からのサンプルを特徴とする特定種類の画像の生成を減らすために、近似機械学習アルゴリズムを提案する。」次に、既存のベースラインと比較してモデルの整合性を保つ上で優れた効果を示す未学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-11-04T13:15:28Z)
Towards Unsupervised Blind Face Restoration using Diffusion Prior [12.69610609088771]
ブラインド顔復元法は、教師付き学習による大規模合成データセットの訓練において、顕著な性能を示した。これらのデータセットは、手作りの画像分解パイプラインで、低品質の顔イメージをシミュレートすることによって生成されることが多い。本稿では, 入力画像の集合のみを用いて, 劣化が不明で, 真理の目標がない場合にのみ, 復元モデルの微調整を行うことにより, この問題に対処する。我々の最良のモデルは、合成と実世界の両方のデータセットの最先端の結果も達成します。
論文参考訳（メタデータ） (2024-10-06T20:38:14Z)
EfficientTrain++: Generalized Curriculum Learning for Efficient Visual Backbone Training [79.96741042766524]
訓練カリキュラムをソフトセレクション機能として再構築する。自然画像の内容の露光は,データ拡張の強度によって容易に達成できることを示す。結果のメソッドであるEfficientTrain++は単純で汎用的だが驚くほど効果的である。
論文参考訳（メタデータ） (2024-05-14T17:00:43Z)
One-Shot Image Restoration [0.0]
提案手法の適用性, 堅牢性, 計算効率を, 教師付き画像の劣化と超解像に応用できることを実験的に示す。本結果は,学習モデルのサンプル効率,一般化,時間複雑性を大幅に改善したことを示す。
論文参考訳（メタデータ） (2024-04-26T14:03:23Z)
Regeneration Based Training-free Attribution of Fake Images Generated by Text-to-Image Generative Models [39.33821502730661]
そこで本研究では,テキスト・ツー・イメージ・モデルによって生成された偽画像をソース・モデルに属性付けするためのトレーニング不要な手法を提案する。テスト画像と候補画像の類似性を計算し、ランキングすることにより、画像のソースを決定することができる。
論文参考訳（メタデータ） (2024-03-03T11:55:49Z)
Scaling Laws of Synthetic Images for Model Training ... for Now [54.43596959598466]
本研究では, 合成画像のスケーリング法則について, テクスト・ツー・イメージ・モデルの現状から検討した。合成画像は、CLIPトレーニングの実際の画像と似ているが、やや効果の低いスケーリング傾向を示す。
論文参考訳（メタデータ） (2023-12-07T18:59:59Z)
Aligning Text-to-Image Diffusion Models with Reward Backpropagation [62.45086888512723]
本稿では,報酬勾配のエンドツーエンドのバックプロパゲーションを用いて,拡散モデルを下流の報酬関数に整合させる手法であるAlignPropを提案する。 AlignPropは、選択肢よりも少ないトレーニングステップでより高い報酬を得るが、概念的にはシンプルである。
論文参考訳（メタデータ） (2023-10-05T17:59:18Z)
Image Captions are Natural Prompts for Text-to-Image Models [70.30915140413383]
本研究では,合成データの学習効果とプロンプトによる合成データ分布の関係を解析した。本稿では,テキストから画像への生成モデルにより,より情報的で多様な学習データを合成する簡易かつ効果的な手法を提案する。本手法は,合成学習データに基づいて訓練したモデルの性能を大幅に向上させる。
論文参考訳（メタデータ） (2023-07-17T14:38:11Z)
Evaluating Data Attribution for Text-to-Image Models [62.844382063780365]
我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文参考訳（メタデータ） (2023-06-15T17:59:51Z)
Supervised Deep Learning for Content-Aware Image Retargeting with Fourier Convolutions [11.031841470875571]
画像は、コンテンツに注意して画像のサイズを変更することを目的としている。ラベル付きデータセットは、イメージタスクでディープラーニングモデルのトレーニングには使用できない。通常の畳み込みニューラルネットワークは、推論時間で異なるサイズの画像を生成することができない。
論文参考訳（メタデータ） (2023-06-12T19:17:44Z)
Few-Shot Learning with Part Discovery and Augmentation from Unlabeled Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文参考訳（メタデータ） (2021-05-25T12:22:11Z)
Understanding invariance via feedforward inversion of discriminatively trained classifiers [30.23199531528357]
過去の研究では、出力ログに余計な視覚的詳細が残っていることが判明した。極めて高い忠実度を再現するフィードフォワードインバージョンモデルを開発する。私たちのアプローチはBigGANをベースにしており、1ホットクラスのラベルの代わりにロジットのコンディショニングを行います。
論文参考訳（メタデータ） (2021-03-15T17:56:06Z)
DeFlow: Learning Complex Image Degradations from Unpaired Data with Conditional Flows [145.83812019515818]
本論文では,不対データから画像劣化を学習するDeFlowを提案する。共有フローデコーダネットワークの潜在空間における劣化過程をモデル化する。共同画像復元と超解像におけるDeFlowの定式化を検証した。
論文参考訳（メタデータ） (2021-01-14T18:58:01Z)
A general approach to bridge the reality-gap [0.0]
これを回避するための一般的なアプローチは、大量のラベル付きデータを持つ既存の類似したデータセットを活用することである。本稿では,任意の画像を正規分布へ変換する一般変換学習を提案する。この変換は教師なしのシステムで訓練され、データの増大を利用して画像の非標準的な例を生成する。
論文参考訳（メタデータ） (2020-09-03T18:19:28Z)
Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文参考訳（メタデータ） (2020-04-14T16:29:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。