論文の概要: Tackling GenAI Copyright Issues: Originality Estimation and Genericization
- arxiv url: http://arxiv.org/abs/2406.03341v6
- Date: Tue, 03 Dec 2024 03:23:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:39:59.870909
- Title: Tackling GenAI Copyright Issues: Originality Estimation and Genericization
- Title(参考訳): GenAI著作権問題に対処する:オリジナル性の推定と生成
- Authors: Hiroaki Chiba-Okabe, Weijie J. Su,
- Abstract要約: 本稿では, 生成モデルの出力を一般化し, 著作権物質を模倣しにくくする汎用化手法を提案する。
そこで本研究では,ジェネリゼーション手法と既存の緩和手法を組み合わせたPrepreGenを紹介する。
- 参考スコア(独自算出の注目度): 25.703494724823756
- License:
- Abstract: The rapid progress of generative AI technology has sparked significant copyright concerns, leading to numerous lawsuits filed against AI developers. Notably, generative AI's capacity for generating copyrighted characters has been well documented in the literature, and while various techniques for mitigating copyright issues have been studied, significant risks remain. Here, we propose a genericization method that modifies the outputs of a generative model to make them more generic and less likely to imitate distinctive features of copyrighted materials. To achieve this, we introduce a metric for quantifying the level of originality of data, estimated by drawing samples from a generative model, and applied in the genericization process. As a practical implementation, we introduce PREGen (Prompt Rewriting-Enhanced Genericization), which combines our genericization method with an existing mitigation technique. Compared to the existing method, PREGen reduces the likelihood of generating copyrighted characters by more than half when the names of copyrighted characters are used as the prompt. Additionally, while generative models can produce copyrighted characters even when their names are not directly mentioned in the prompt, PREGen almost entirely prevents the generation of such characters in these cases.
- Abstract(参考訳): 生成AI技術の急速な進歩は、重要な著作権上の懸念を引き起こし、AI開発者に対する数多くの訴訟を引き起こした。
特に、著作権付き文字を生成するための生成AIの能力は文献によく記録されており、著作権問題を緩和するための様々な技術が研究されているが、重大なリスクは残されている。
本稿では, 生成モデルの出力を, より汎用的で, 著作権物質の特徴を模倣する可能性が低いように改良する汎用化手法を提案する。
そこで本研究では,データ生成モデルからサンプルを抽出して推定したデータの独創性レベルを定量化し,ジェネリック化プロセスに適用する指標を提案する。
本稿では,プリジェン(Prompt Rewriting-Enhanced Genericization)を導入し,ジェネリゼーション手法と既存の緩和手法を組み合わせる。
既存の方法と比較して、Pregenは、著作権付き文字の名前がプロンプトとして使用される場合、著作権付き文字を半分以上生成する可能性を減らす。
さらに、生成モデルは、プロンプトに名前が直接言及されていない場合でも、著作権付き文字を生成できるが、PreGenはそのような文字の生成をほとんど完全に妨げている。
関連論文リスト
- CopyBench: Measuring Literal and Non-Literal Reproduction of Copyright-Protected Text in Language Model Generation [132.00910067533982]
LM世代におけるリテラルコピーと非リテラルコピーの両方を測定するために設計されたベンチマークであるCopyBenchを紹介する。
リテラル複写は比較的稀であるが、イベント複写と文字複写という2種類の非リテラル複写は、7Bパラメータのモデルでも発生する。
論文 参考訳(メタデータ) (2024-07-09T17:58:18Z) - Fantastic Copyrighted Beasts and How (Not) to Generate Them [83.77348858322523]
著作権のある文字は、画像生成サービスにとって難しい課題となる。
少なくとも1つの訴訟は、これらのキャラクターの世代に基づいて損害を受けた。
論文 参考訳(メタデータ) (2024-06-20T17:38:16Z) - Evaluating and Mitigating IP Infringement in Visual Generative AI [54.24196167576133]
最先端のビジュアル生成モデルは、知的財産権によって保護されたキャラクターと著しく類似したコンテンツを生成することができる。
これは、入力プロンプトが文字の名前を含む場合や、その特性に関する記述的な詳細を含む場合に発生する。
我々は、潜在的に侵害される可能性のあるコンテンツを特定し、IP侵害を防止するための修正された生成パラダイムを開発する。
論文 参考訳(メタデータ) (2024-06-07T06:14:18Z) - U Can't Gen This? A Survey of Intellectual Property Protection Methods for Data in Generative AI [4.627725143147341]
トレーニングデータの知的財産権に関する懸念について検討する。
我々は、潜在的なIP違反につながる誤用を可能にする生成モデルの性質に焦点を当てる。
論文 参考訳(メタデータ) (2024-04-22T09:09:21Z) - Uncertain Boundaries: Multidisciplinary Approaches to Copyright Issues in Generative AI [2.669847575321326]
この調査は、最新の開発とオープンな問題に逆らうことを目的としている。
まず、テキスト、画像、ビデオなどのメディアにおける著作権侵害を検出する方法の概要を示す。
次に、著作権のある作品を生成モデルから保護することを目的とした既存の技術を探究する。
論文 参考訳(メタデータ) (2024-03-31T22:10:01Z) - Not All Similarities Are Created Equal: Leveraging Data-Driven Biases to Inform GenAI Copyright Disputes [20.237329910319293]
本稿では,GenAIモデルの学習能力を利用した著作権法解析手法を提案する。
我々は、GenAIによって作成された作品の汎用性を特定するためのデータ駆動型アプローチを提案する。
著作権法における表現的汎用性を測定することの潜在的意味は深い。
論文 参考訳(メタデータ) (2024-03-26T13:32:32Z) - Copyright Protection in Generative AI: A Technical Perspective [58.84343394349887]
ジェネレーティブAIは近年急速に進歩し、テキスト、画像、オーディオ、コードなどの合成コンテンツを作成する能力を拡大している。
これらのディープ・ジェネレーティブ・モデル(DGM)が生成したコンテンツの忠実さと信頼性が、著作権の重大な懸念を引き起こしている。
この研究は、技術的観点から著作権保護の包括的概要を提供することで、この問題を深く掘り下げている。
論文 参考訳(メタデータ) (2024-02-04T04:00:33Z) - A Dataset and Benchmark for Copyright Infringement Unlearning from Text-to-Image Diffusion Models [52.49582606341111]
著作権法は、クリエイティブ作品を再生、配布、収益化する排他的権利をクリエイターに与えている。
テキスト・ツー・イメージ・ジェネレーションの最近の進歩は、著作権の執行に重大な課題をもたらしている。
CLIP、ChatGPT、拡散モデルを調和させてデータセットをキュレートする新しいパイプラインを導入する。
論文 参考訳(メタデータ) (2024-01-04T11:14:01Z) - Securing Deep Generative Models with Universal Adversarial Signature [69.51685424016055]
深い生成モデルは、その潜在的な誤用のために社会に脅威をもたらす。
本稿では,任意の事前学習型生成モデルに普遍的逆数シグネチャを注入することを提案する。
提案手法は, FFHQ と ImageNet のデータセット上で, 様々な最先端生成モデルを用いて検証する。
論文 参考訳(メタデータ) (2023-05-25T17:59:01Z) - Can Copyright be Reduced to Privacy? [23.639303165101385]
アルゴリズムの安定性は、コピーを検出する実用的なツールとして認識されるかもしれないが、そのようなコピーは必ずしも著作権侵害を構成するものではない、と我々は主張する。
著作権侵害の確立の基準として採択された場合、アルゴリズム的安定性は著作権法の意図された目的を損なう可能性がある。
論文 参考訳(メタデータ) (2023-05-24T07:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。