論文の概要: Reading Between the Lines: Towards Reliable Black-box LLM Fingerprinting via Zeroth-order Gradient Estimation
- arxiv url: http://arxiv.org/abs/2510.06605v1
- Date: Wed, 08 Oct 2025 03:27:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.277138
- Title: Reading Between the Lines: Towards Reliable Black-box LLM Fingerprinting via Zeroth-order Gradient Estimation
- Title(参考訳): ライン間の読み書き:ゼロ階勾配推定による信頼性の高いブラックボックスLDMフィンガープリントに向けて
- Authors: Shuo Shao, Yiming Li, Hongwei Yao, Yifei Chen, Yuchen Yang, Zhan Qin,
- Abstract要約: ブラックボックス法は、しばしば顕著なLarge Language Modelsの指紋を生成するのに失敗する。
ゼロオーダー推定を用いたブラックボックス設定における情報豊富な勾配を近似する新しい手法であるZeroPrintを提案する。
標準ベンチマークの実験では、ZeroPrintは最先端の有効性とロバスト性を達成し、既存のブラックボックスメソッドを著しく上回っている。
- 参考スコア(独自算出の注目度): 33.83669045868836
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The substantial investment required to develop Large Language Models (LLMs) makes them valuable intellectual property, raising significant concerns about copyright protection. LLM fingerprinting has emerged as a key technique to address this, which aims to verify a model's origin by extracting an intrinsic, unique signature (a "fingerprint") and comparing it to that of a source model to identify illicit copies. However, existing black-box fingerprinting methods often fail to generate distinctive LLM fingerprints. This ineffectiveness arises because black-box methods typically rely on model outputs, which lose critical information about the model's unique parameters due to the usage of non-linear functions. To address this, we first leverage Fisher Information Theory to formally demonstrate that the gradient of the model's input is a more informative feature for fingerprinting than the output. Based on this insight, we propose ZeroPrint, a novel method that approximates these information-rich gradients in a black-box setting using zeroth-order estimation. ZeroPrint overcomes the challenge of applying this to discrete text by simulating input perturbations via semantic-preserving word substitutions. This operation allows ZeroPrint to estimate the model's Jacobian matrix as a unique fingerprint. Experiments on the standard benchmark show ZeroPrint achieves a state-of-the-art effectiveness and robustness, significantly outperforming existing black-box methods.
- Abstract(参考訳): LLM(Large Language Models)の開発に必要な相当な投資は、それらに価値ある知的財産をもたらし、著作権保護に関する重大な懸念を提起する。
LLMフィンガープリントは、本質的なユニークなシグネチャ("フィンガープリント")を抽出し、それをソースモデルと比較して不正コピーを特定することによって、モデルの起源を検証することを目的としている。
しかし、既存のブラックボックスのフィンガープリント法は、しばしば固有のLDMフィンガープリントを生成するのに失敗する。
この非効率性は、ブラックボックス法が典型的にはモデル出力に依存しており、非線形関数の使用によりモデル固有のパラメータに関する重要な情報を失うため生じる。
これを解決するために、我々はまずフィッシャー情報理論を活用し、モデル入力の勾配が出力よりも指紋認証にとってより有益な特徴であることを正式に示す。
この知見に基づき、ゼロオーダー推定を用いたブラックボックス設定において、これらの情報に富む勾配を近似する新しい手法であるZeroPrintを提案する。
ZeroPrintは、意味保存語置換によって入力摂動をシミュレートすることで、これを離散テキストに適用するという課題を克服する。
この操作により、ZeroPrintはモデルのヤコビ行列をユニークな指紋として推定することができる。
標準ベンチマークの実験では、ZeroPrintは最先端の有効性とロバスト性を達成し、既存のブラックボックスメソッドを著しく上回っている。
関連論文リスト
- SeedPrints: Fingerprints Can Even Tell Which Seed Your Large Language Model Was Trained From [65.75182441010327]
我々は,LDMフィンガープリントのより強く,より本質的な概念であるSeedPrintsを提案する。
トレーニングされていないモデルでは,パラメータのみに依存した再現可能なトークン選択バイアスが示される。
LLaMAスタイルとQwenスタイルのモデルの実験では、SeedPrintsはシードレベルの識別性を実現し、バイオメトリック指紋に似た生来からライフサイクルの識別認証を提供する。
論文 参考訳(メタデータ) (2025-09-30T15:34:08Z) - Fingerprinting LLMs via Prompt Injection [16.907123772391213]
大規模言語モデル(LLM)は、後処理や量子化といった後処理によって、リリース後にしばしば修正される。
既存のプロファイランス検出手法には,(1)リリース前のベースモデルにシグナルを埋め込む,(2)手作りのプロンプトやランダムなプロンプトを用いたモデル間の出力を比較する,という2つの制限がある。
我々はLLMPrintを提案する。LLMPrintはLDM固有の脆弱性を利用して指紋を検知する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-09-29T19:54:36Z) - SoK: Large Language Model Copyright Auditing via Fingerprinting [69.14570598973195]
既存の手法をホワイトボックスとブラックボックスのアプローチに分類する統一的な枠組みと形式的な分類法を導入する。
現実的な展開シナリオ下でのLDMフィンガープリント評価のための最初の体系的ベンチマークであるLeaFBenchを提案する。
論文 参考訳(メタデータ) (2025-08-27T12:56:57Z) - MergePrint: Merge-Resistant Fingerprints for Robust Black-box Ownership Verification of Large Language Models [1.9249287163937978]
モデルマージを継続することのできる頑健な指紋を埋め込むための新しいフィンガープリント手法であるMergePrintを提案する。
MergePrintはブラックボックスのオーナシップの検証を可能にする。モデルが特定の指紋入力に対してターゲット出力を生成するかどうかのみを所有者が確認する必要がある。
論文 参考訳(メタデータ) (2024-10-11T08:00:49Z) - Instructional Fingerprinting of Large Language Models [57.72356846657551]
本稿では,非常に軽量なインストラクションチューニングの一形態として,Large Language Model (LLM) の指紋認証に関する実験的検討を行う。
11個の LLM 実験の結果,このアプローチは軽量であり,モデルの正常な挙動には影響しないことがわかった。
また、パブリッシャーの誇張を防ぎ、指紋の推測やパラメータ効率のトレーニングに対する堅牢性を維持し、MITライセンスのような多段階の指紋認証をサポートする。
論文 参考訳(メタデータ) (2024-01-21T09:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。