論文の概要: Scalable Fingerprinting of Large Language Models
- arxiv url: http://arxiv.org/abs/2502.07760v1
- Date: Tue, 11 Feb 2025 18:43:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:08:22.086806
- Title: Scalable Fingerprinting of Large Language Models
- Title(参考訳): 大規模言語モデルのスケーラブルフィンガープリント
- Authors: Anshul Nasery, Jonathan Hayase, Creston Brooks, Peiyao Sheng, Himanshu Tyagi, Pramod Viswanath, Sewoong Oh,
- Abstract要約: 我々はPerinucleus sampleと呼ばれる新しい手法を導入し、スケーラブルで永続的で無害な指紋を生成する。
この手法により,Llama-3.1-8Bモデルに24,576個の指紋を付加できることを示した。
- 参考スコア(独自算出の注目度): 46.26999419117367
- License:
- Abstract: Model fingerprinting has emerged as a powerful tool for model owners to identify their shared model given API access. However, to lower false discovery rate, fight fingerprint leakage, and defend against coalitions of model users attempting to bypass detection, we argue that {\em scalability} is critical, i.e., scaling up the number of fingerprints one can embed into a model. Hence, we pose scalability as a crucial requirement for fingerprinting schemes. We experiment with fingerprint design at a scale significantly larger than previously considered, and introduce a new method, dubbed Perinucleus sampling, to generate scalable, persistent, and harmless fingerprints. We demonstrate that this scheme can add 24,576 fingerprints to a Llama-3.1-8B model -- two orders of magnitude more than existing schemes -- without degrading the model's utility. Our inserted fingerprints persist even after supervised fine-tuning on standard post-training data. We further address security risks for fingerprinting, and theoretically and empirically show how a scalable fingerprinting scheme like ours can mitigate these risks.
- Abstract(参考訳): モデルフィンガープリントは、モデル所有者がAPIアクセスによって共有モデルを特定するための強力なツールとして登場した。
しかし、偽の発見率を下げ、指紋漏洩と闘い、検出をバイパスしようとするモデルユーザーの連立に対抗するためには、拡張性は重要であり、すなわちモデルに埋め込まれる指紋の数をスケールアップする、と我々は主張する。
したがって,指紋認証方式において,スケーラビリティが重要な要件となっている。
従来考えられていたよりもはるかに大きなスケールで指紋デザインを実験し、スケーラブルで永続的で無害な指紋を生成するためにPerinucleus sampleと呼ばれる新しい方法を導入する。
このスキームは、Llama-3.1-8Bモデル(既存のスキームよりも2桁多い)に24,576個の指紋を追加することができるが、モデルの実用性は劣化しない。
インサート指紋は,標準訓練後データに基づく微調整を監督した後も持続する。
我々はさらに、フィンガープリントのセキュリティリスクに対処し、理論上も経験的にも、我々のようなスケーラブルなフィンガープリント方式が、これらのリスクを緩和できることを示す。
関連論文リスト
- Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique [2.7174461714624805]
Chain & Hashは、暗号化されたフレーバーで指紋を実装する、新しいシンプルなフィンガープリントアプローチだ。
チェイン・アンド・ハッシュ法を複数のモデルで評価し,良性変換に対するロバスト性を実証した。
論文 参考訳(メタデータ) (2024-07-15T16:38:56Z) - Hierarchical Perceptual Noise Injection for Social Media Fingerprint
Privacy Protection [106.5308793283895]
ソーシャルメディアからの指紋漏洩は 画像を匿名化したいという強い欲求を喚起します
指紋漏洩を保護するために、画像に知覚不能な摂動を加えることにより、敵攻撃が解決策として現れる。
この問題を解決するために,階層型パーセプティカルノイズ注入フレームワークであるFingerSafeを提案する。
論文 参考訳(メタデータ) (2022-08-23T02:20:46Z) - FBI: Fingerprinting models with Benign Inputs [17.323638042215013]
本稿では,モデルファミリとその変種の概念を一般化することにより,モデルの大幅な修正に耐性のある指紋認証方式を提案する。
我々は、修正されていない画像である良性入力が、両方のタスクに十分な材料であることを実証することによって、両方の目標を達成する。
どちらのアプローチも、かつてない1000以上のネットワークに対して実験的に検証されている。
論文 参考訳(メタデータ) (2022-08-05T13:55:36Z) - On the vulnerability of fingerprint verification systems to fake
fingerprint attacks [57.36125468024803]
中規模の偽指紋データベースを記述し、2つの異なる指紋認証システムを評価する。
光およびサーマルスイーピングセンサの結果が提供される。
論文 参考訳(メタデータ) (2022-07-11T12:22:52Z) - Pair-Relationship Modeling for Latent Fingerprint Recognition [25.435974669629374]
本稿では,2つの指紋のペア関係を認識の類似性として直接モデル化する手法を提案する。
2つのデータベースに対する実験結果から,提案手法が技術状況より優れていることが示された。
論文 参考訳(メタデータ) (2022-07-02T11:31:31Z) - FingerGAN: A Constrained Fingerprint Generation Scheme for Latent
Fingerprint Enhancement [23.67808389519383]
拘束指紋生成問題として潜伏指紋強調法を定式化する手法を提案する。
2つの公開潜伏指紋データベースによる実験結果から,本手法が芸術の状態を著しく上回ることが示された。
論文 参考訳(メタデータ) (2022-06-26T14:05:21Z) - Responsible Disclosure of Generative Models Using Scalable
Fingerprinting [70.81987741132451]
深層生成モデルは質的に新しいパフォーマンスレベルを達成した。
この技術がスプーフセンサーに誤用され、ディープフェイクを発生させ、大規模な誤情報を可能にするという懸念がある。
最先端のジェネレーションモデルを責任を持って公開することで、研究者や企業がモデルに指紋を刻むことができます。
論文 参考訳(メタデータ) (2020-12-16T03:51:54Z) - Artificial Fingerprinting for Generative Models: Rooting Deepfake
Attribution in Training Data [64.65952078807086]
光現実性画像生成は、GAN(Generative Adversarial Network)のブレークスルーにより、新たな品質レベルに達した。
しかし、このようなディープフェイクのダークサイド、すなわち生成されたメディアの悪意ある使用は、視覚的誤報に関する懸念を提起する。
我々は,モデルに人工指紋を導入することによって,深度検出の積極的な,持続可能なソリューションを模索する。
論文 参考訳(メタデータ) (2020-07-16T16:49:55Z) - Latent Fingerprint Registration via Matching Densely Sampled Points [100.53031290339483]
既存の潜伏指紋登録手法は、主にミツバチ間の対応を確立することに基づいている。
本研究では,一対の指紋間の空間的変換を推定する,最小限の潜伏指紋登録手法を提案する。
提案手法は,特に挑戦的な条件下で,最先端の登録性能を実現する。
論文 参考訳(メタデータ) (2020-05-12T15:51:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。