論文の概要: Text-image guided Diffusion Model for generating Deepfake celebrity
interactions
- arxiv url: http://arxiv.org/abs/2309.14751v1
- Date: Tue, 26 Sep 2023 08:24:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 14:34:52.423923
- Title: Text-image guided Diffusion Model for generating Deepfake celebrity
interactions
- Title(参考訳): ディープフェイクセレブインタラクション生成のためのテキスト画像誘導拡散モデル
- Authors: Yunzhuo Chen, Nur Al Hasan Haldar, Naveed Akhtar, Ajmal Mian
- Abstract要約: 拡散モデルは近年、非常にリアルなビジュアルコンテンツ生成を実証している。
本稿では,その点において新しい手法を考案し,検討する。
提案手法により, 現実感を脅かすことなく, 偽の視覚コンテンツを作成できることが示唆された。
- 参考スコア(独自算出の注目度): 50.37578424163951
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deepfake images are fast becoming a serious concern due to their realism.
Diffusion models have recently demonstrated highly realistic visual content
generation, which makes them an excellent potential tool for Deepfake
generation. To curb their exploitation for Deepfakes, it is imperative to first
explore the extent to which diffusion models can be used to generate realistic
content that is controllable with convenient prompts. This paper devises and
explores a novel method in that regard. Our technique alters the popular stable
diffusion model to generate a controllable high-quality Deepfake image with
text and image prompts. In addition, the original stable model lacks severely
in generating quality images that contain multiple persons. The modified
diffusion model is able to address this problem, it add input anchor image's
latent at the beginning of inferencing rather than Gaussian random latent as
input. Hence, we focus on generating forged content for celebrity interactions,
which may be used to spread rumors. We also apply Dreambooth to enhance the
realism of our fake images. Dreambooth trains the pairing of center words and
specific features to produce more refined and personalized output images. Our
results show that with the devised scheme, it is possible to create fake visual
content with alarming realism, such that the content can serve as believable
evidence of meetings between powerful political figures.
- Abstract(参考訳): ディープフェイク画像は、現実主義のために急速に深刻な関心事になりつつある。
拡散モデルは近年、非常にリアルなビジュアルコンテンツ生成を実証しており、ディープフェイク生成の優れた潜在的なツールとなっている。
ディープフェイクの利用を抑えるためには、まず拡散モデルを使って、便利なプロンプトで制御可能なリアルなコンテンツを生成する方法を探求する必要がある。
そこで本稿では,新しい手法を考案し,検討する。
提案手法は,一般的な安定拡散モデルを変化させ,テキストと画像のプロンプトで制御可能な高品質なDeepfake画像を生成する。
さらに、オリジナルの安定モデルは、複数の人を含む品質画像を生成するのに非常に不足している。
修正拡散モデルはこの問題に対処することができ、入力としてガウスランダム潜像ではなく、推論の開始時に入力アンカー画像の潜像を追加する。
したがって、噂を広めるのに使われるかもしれないセレブとの交流のために、偽コンテンツを生成することに焦点を合わせます。
また、偽画像の現実性を高めるためにDreamboothを適用します。
dreamboothは、中心となる単語と特定の特徴のペアリングを訓練し、より洗練されたパーソナライズされた出力画像を生成する。
提案手法により, 現実主義を脅かすような偽の視覚コンテンツを作成することが可能であり, 強大な政治的人物同士の出会いの有効な証拠となることが示唆された。
関連論文リスト
- Improving face generation quality and prompt following with synthetic captions [57.47448046728439]
画像から正確な外観記述を生成するために,トレーニング不要のパイプラインを導入する。
次に、これらの合成キャプションを使用して、テキストから画像への拡散モデルを微調整する。
提案手法は,高品質で現実的な人間の顔を生成するモデルの能力を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-05-17T15:50:53Z) - Unveiling the Truth: Exploring Human Gaze Patterns in Fake Images [34.02058539403381]
我々は、人間の意味的知識を活用して、偽画像検出のフレームワークに含まれる可能性を調べる。
予備的な統計的分析により、人間が本物の画像や変化した画像をどのように知覚するかの特徴的なパターンを探索する。
論文 参考訳(メタデータ) (2024-03-13T19:56:30Z) - Improving Diffusion Models for Authentic Virtual Try-on in the Wild [53.96244595495942]
本稿では,キュレートされた衣服を身に着けている人のイメージをレンダリングする,イメージベースの仮想試行について考察する。
衣服の忠実度を改善し,仮想試行画像を生成する新しい拡散モデルを提案する。
本稿では,一対の人着画像を用いたカスタマイズ手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T08:12:18Z) - Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis [65.7968515029306]
PGPIS(Pose-Guided Person Image Synthesis)のためのCFLD(Coarse-to-Fine Latent Diffusion)法を提案する。
認識修正デコーダは、学習可能なクエリの集合を段階的に洗練し、粗いプロンプトとして人物画像の意味的理解を抽出するように設計されている。
論文 参考訳(メタデータ) (2024-02-28T06:07:07Z) - SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with
Large Language Models [56.88192537044364]
本研究では,事前学習拡散モデルに対するセマンティック・アダプタ (SUR-adapter) と呼ばれる簡易なパラメータ効率の良い微調整手法を提案する。
ユーザエクスペリエンスの向上により,テキストから画像への拡散モデルの使いやすさが向上する。
論文 参考訳(メタデータ) (2023-05-09T05:48:38Z) - SINE: SINgle Image Editing with Text-to-Image Diffusion Models [10.67527134198167]
本研究の目的は、単一画像編集の問題に対処することである。
分類器フリーガイダンスに基づく新しいモデルベースガイダンスを提案する。
スタイルの変更、コンテンツの追加、オブジェクト操作など、有望な編集機能を示す。
論文 参考訳(メタデータ) (2022-12-08T18:57:13Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - On the detection of synthetic images generated by diffusion models [18.12766911229293]
拡散モデル(DM)に基づく手法が注目されている。
DMはテキストベースのビジュアルコンテンツの作成を可能にする。
悪意のあるユーザーは、自分の攻撃に完全に適合した偽のメディアを生成し、配布することができる。
論文 参考訳(メタデータ) (2022-11-01T18:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。