論文の概要: Detecting Non-Membership in LLM Training Data via Rank Correlations
- arxiv url: http://arxiv.org/abs/2603.22707v1
- Date: Tue, 24 Mar 2026 01:59:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.24604
- Title: Detecting Non-Membership in LLM Training Data via Rank Correlations
- Title(参考訳): ランク相関によるLLMトレーニングデータの非機械的検出
- Authors: Pranav Shetty, Mirazul Haque, Zhiqiang Ma, Xiaomo Liu,
- Abstract要約: モデルロジットへのグレーボックスアクセスのみを使用してデータセットレベルの非メンバシップを検出するテストであるPRISMを紹介する。
我々の重要な洞察は、データセットを見たことのない2つのモデルが、正規化トークンログの確率において、1つのモデルがそのデータに基づいてトレーニングされた時よりも高いランク相関を示すことである。
PRISMは、偽陽性を避けながら、テストされたすべてのデータセットにわたるトレーニングデータのメンバシップを確実に除外する。
- 参考スコア(独自算出の注目度): 12.012691770844278
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As large language models (LLMs) are trained on increasingly vast and opaque text corpora, determining which data contributed to training has become essential for copyright enforcement, compliance auditing, and user trust. While prior work focuses on detecting whether a dataset was used in training (membership inference), the complementary problem -- verifying that a dataset was not used -- has received little attention. We address this gap by introducing PRISM, a test that detects dataset-level non-membership using only grey-box access to model logits. Our key insight is that two models that have not seen a dataset exhibit higher rank correlation in their normalized token log probabilities than when one model has been trained on that data. Using this observation, we construct a correlation-based test that detects non-membership. Empirically, PRISM reliably rules out membership in training data across all datasets tested while avoiding false positives, thus offering a framework for verifying that specific datasets were excluded from LLM training.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ますます広範で不透明なテキストコーパスで訓練されるため、トレーニングに寄与するデータを決定することは、著作権執行、コンプライアンス監査、ユーザ信頼にとって欠かせないものとなっている。
以前の作業では、データセットがトレーニングで使用されたかどうか(メンバシップ推論)の検出に重点を置いていたが、補完的な問題 — データセットが使用されていないことを検証する — はほとんど注目されていない。
モデルロジットへのグレーボックスアクセスのみを使用してデータセットレベルの非メンバシップを検出するテストであるPRISMを導入することで、このギャップに対処する。
我々の重要な洞察は、データセットを見たことのない2つのモデルが、正規化トークンログの確率において、1つのモデルがそのデータに基づいてトレーニングされた時よりも高いランク相関を示すことである。
この観測により,非メンバーシップを検出する相関型テストを構築した。
実証的には、PRISMは偽陽性を避けながらテストされたすべてのデータセットのトレーニングデータのメンバシップを確実に除外するので、特定のデータセットがLLMトレーニングから除外されていることを検証するためのフレームワークを提供する。
関連論文リスト
- Hey, That's My Data! Label-Only Dataset Inference in Large Language Models [63.35066172530291]
CatShiftはラベルのみのデータセット推論フレームワークである。
LLMは、新しいデータに晒されたとき、学習した知識を上書きする傾向にある。
論文 参考訳(メタデータ) (2025-06-06T13:02:59Z) - Dataset Ownership Verification in Contrastive Pre-trained Models [37.03747798645621]
コントラスト学習による自己教師付き事前学習モデルに適した,最初のデータセットオーナシップ検証手法を提案する。
提案手法の有効性を,SimCLR, BYOL, SimSiam, MOCO v3, DINO など,複数のコントラスト付き事前学習モデルで検証した。
論文 参考訳(メタデータ) (2025-02-11T05:42:21Z) - Self-Comparison for Dataset-Level Membership Inference in Large (Vision-)Language Models [73.94175015918059]
本稿では,自己比較に基づくデータセットレベルのメンバシップ推定手法を提案する。
本手法では, 同一分布における地中構造データや非構造データへのアクセスは不要である。
論文 参考訳(メタデータ) (2024-10-16T23:05:59Z) - Detecting Training Data of Large Language Models via Expectation Maximization [62.28028046993391]
本稿では,予測最大化アルゴリズムを用いて,メンバーシップスコアとプレフィックススコアを反復的に洗練する新しいメンバーシップ推論手法EM-MIAを紹介する。
EM-MIAはWikiMIAで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-10T03:31:16Z) - Nob-MIAs: Non-biased Membership Inference Attacks Assessment on Large Language Models with Ex-Post Dataset Construction [37.69303106863453]
メンバーシップ推論攻撃 (MIA) は、特定の文書が与えられたLarge Language Models (LLM) プリトレーニングで使用されたかどうかを検出することを目的としている。
本稿では,LLMにおけるMIAの評価について述べる。
我々は、より公平なMIA評価のために、非バイアス'と非分類'のデータセットを作成するアルゴリズムを提案し、検証する。
論文 参考訳(メタデータ) (2024-08-12T07:49:28Z) - ReCaLL: Membership Inference via Relative Conditional Log-Likelihoods [56.073335779595475]
本稿ではReCaLL(Relative Conditional Log-Likelihood)を提案する。
実験の結果,非メンバープレフィックスの条件付きメンバーデータは,非メンバーデータと比較してログライクな傾向が著しく低下することがわかった。
我々は総合的な実験を行い、ReCaLLがWikiMIAデータセット上で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-06-23T00:23:13Z) - ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for
Semi-supervised Continual Learning [52.831894583501395]
連続学習は、入力されたデータが完全にラベル付けされていると仮定し、実際のアプリケーションでは適用できないかもしれない。
我々は、条件付き生成逆数ネットワーク(GAN)を用いた分類器を相互に学習するために、識別器整合(ORDisCo)を用いたディープオンライン再生を提案する。
ORDisCo が SSCL の様々な半教師付き学習ベンチマークデータセットで大幅なパフォーマンス向上を達成していることを示します。
論文 参考訳(メタデータ) (2021-01-02T09:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。