論文の概要: Not with my name! Inferring artists' names of input strings employed by
Diffusion Models
- arxiv url: http://arxiv.org/abs/2307.13527v1
- Date: Tue, 25 Jul 2023 14:18:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 16:46:30.473443
- Title: Not with my name! Inferring artists' names of input strings employed by
Diffusion Models
- Title(参考訳): 俺の名前じゃない!
拡散モデルを用いた入力文字列のアーティスト名の推定
- Authors: Roberto Leotta, Oliver Giudice, Luca Guarnera, Sebastiano Battiato
- Abstract要約: 拡散モデル(DM)は、現実的で高品質な画像を生成するのに非常に効果的である。
しかし、これらのモデルは創造性に欠けており、単にトレーニングデータに基づいて出力を構成するだけである。
本稿では,生成画像の入力文字列におけるアーティスト名の使用確率を推定する予備的研究について述べる。
- 参考スコア(独自算出の注目度): 8.692128987695423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion Models (DM) are highly effective at generating realistic,
high-quality images. However, these models lack creativity and merely compose
outputs based on their training data, guided by a textual input provided at
creation time. Is it acceptable to generate images reminiscent of an artist,
employing his name as input? This imply that if the DM is able to replicate an
artist's work then it was trained on some or all of his artworks thus violating
copyright. In this paper, a preliminary study to infer the probability of use
of an artist's name in the input string of a generated image is presented. To
this aim we focused only on images generated by the famous DALL-E 2 and
collected images (both original and generated) of five renowned artists.
Finally, a dedicated Siamese Neural Network was employed to have a first kind
of probability. Experimental results demonstrate that our approach is an
optimal starting point and can be employed as a prior for predicting a complete
input string of an investigated image. Dataset and code are available at:
https://github.com/ictlab-unict/not-with-my-name .
- Abstract(参考訳): 拡散モデル(DM)はリアルで高品質な画像を生成するのに非常に効果的である。
しかし、これらのモデルは創造性に欠けており、作成時に提供されるテキスト入力によって導かれるトレーニングデータに基づいて出力を構成するだけである。
彼の名前を入力として、アーティストのイメージを生成することは受け入れられますか?
これは、もしdmがアーティストの作品を複製できるなら、彼の作品の一部または全てで訓練され、著作権に違反していることを意味する。
本稿では,生成画像の入力文字列におけるアーティスト名の使用確率を推定する予備的研究について述べる。
そこで我々は,有名なDALL-E 2が生成した画像のみに焦点をあて,著名な5人のアーティストのイメージ(オリジナルと生成の両方)を収集した。
最後に、シームズニューラルネットワークが第一種確率を持つために採用された。
実験の結果,本手法は最適な出発点であり,検討した画像の完全入力文字列の予測に先立って適用可能であることが示された。
データセットとコードは、https://github.com/ictlab-unict/not-with-my-name。
関連論文リスト
- How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold [50.33428591760124]
学習データセットにおける概念の頻度とモデルを模倣する能力の関係について検討する。
我々は,複数のモデルをスクラッチからトレーニングする余剰コストを発生させることなく,模倣閾値を推定する効率的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-19T06:28:14Z) - How to Trace Latent Generative Model Generated Images without Artificial Watermark? [88.04880564539836]
潜在生成モデルによって生成された画像に関する潜在的な誤用に関する懸念が持ち上がっている。
検査されたモデルの生成された画像をトレースするために,レイトタントトラッカーと呼ばれる潜時反転に基づく手法を提案する。
提案手法は,検査したモデルと他の画像から生成された画像とを高精度かつ効率的に識別できることを示す。
論文 参考訳(メタデータ) (2024-05-22T05:33:47Z) - Measuring the Success of Diffusion Models at Imitating Human Artists [7.007492782620398]
モデルが特定のアーティストを模倣する能力を測定する方法を示す。
コントラスト言語-画像事前訓練(CLIP)エンコーダを用いてゼロショット方式で画像の分類を行う。
また,アーティストの作品のサンプルを,これらの模倣画像と高い統計的信頼性で一致させることができることを示す。
論文 参考訳(メタデータ) (2023-07-08T18:31:25Z) - DIAGNOSIS: Detecting Unauthorized Data Usages in Text-to-image Diffusion Models [79.71665540122498]
保護されたデータセットにインジェクトされたコンテンツを配置することで、不正なデータ利用を検出する手法を提案する。
具体的には、ステルス画像ワープ機能を用いて、これらの画像にユニークな内容を追加することにより、保護された画像を修正する。
このモデルが注入されたコンテンツを記憶したかどうかを解析することにより、不正に不正に使用したモデルを検出することができる。
論文 参考訳(メタデータ) (2023-07-06T16:27:39Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - CLIP-Art: Contrastive Pre-training for Fine-Grained Art Classification [7.6146285961466]
私たちは、CLIP(Contrastive Language- Image Pre-Training)を使用して、さまざまなアートイメージとテキスト記述ペアでニューラルネットワークをトレーニングする最初の方法の1つです。
本手法は,インスタンス検索と細粒度アートワーク属性認識という2つの課題を解決することを目的としている。
このベンチマークでは、自己スーパービジョンのみを使用して、競争結果を達成しました。
論文 参考訳(メタデータ) (2022-04-29T17:17:24Z) - Exploring Latent Dimensions of Crowd-sourced Creativity [0.02294014185517203]
私たちは、AIベースの最大のクリエイティビティプラットフォームであるArtbreederの開発を行っています。
このプラットフォーム上で生成された画像の潜在次元を探索し、画像を操作するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-13T19:24:52Z) - Words as Art Materials: Generating Paintings with Sequential GANs [8.249180979158815]
大規模な分散データセット上での芸術画像の生成について検討する。
このデータセットには、形状、色、内容など、バリエーションのあるイメージが含まれている。
本稿では,逐次生成適応型ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-07-08T19:17:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。