論文の概要: Have You Ever Seen Them? Entity-level Membership Inference through Interrogating Large Language Models
- arxiv url: http://arxiv.org/abs/2606.23030v1
- Date: Mon, 22 Jun 2026 08:40:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:22:44.119428
- Title: Have You Ever Seen Them? Entity-level Membership Inference through Interrogating Large Language Models
- Title(参考訳): エンティティレベルのメンバシップ推論は,大規模言語モデルの解釈を通じて実現したか?
- Authors: Yiran Zhu, Ziqi Yang,
- Abstract要約: LLM(Large Language Models)は、プライバシの漏洩や著作権の遵守に関する懸念が高まっている。
LLMトレーニングに対象エンティティに関連する情報が使用されているかどうかを判定するエンティティレベルのメンバシップ推論を提案する。
エンティティレベルのデータセットを構築し、最先端のサンプルレベルのラベルのみのメソッドをベースラインとしてエンティティレベルの設定に適用する。
- 参考スコア(独自算出の注目度): 6.8669133150322255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) raise growing concerns about privacy leakage and copyright compliance. Membership inference is a key tool for assessing such risks, but existing studies mainly focus on whether specific samples or sample-based data units are used for training. We argue that LLMs exhibit a human-memory-like behavior: an LLM may not memorize a specific sample verbatim, yet it can accumulate and reveal knowledge about a real-world entity from scattered mentions. This analogy motivates us to examine whether an LLM can be interrogated like a human interviewee to reveal its exposure to entity-related information. Motivated by this question, we propose entity-level membership inference, which determines whether information related to a target entity is used in LLM training. We study this task in the practical label-only black-box setting, where only generated texts are observable. We formalize the task under clue, input, and model constraints, establish the necessary and sufficient conditions for its feasibility, and instantiate five interrogation strategies based on this formalization. The strategies use limited entity clues to construct prompts, elicit entity-related responses, and infer membership from semantic features among the generated texts. We construct entity-level datasets and adapt state-of-the-art sample-level label-only methods to the entity-level setting as baselines. Experiments on person entities show that our methods achieve AUC up to 0.97 and bring gains of 6.0%--17.5% in Balanced Accuracy over the best adapted baseline.
- Abstract(参考訳): LLM(Large Language Models)は、プライバシの漏洩や著作権の遵守に関する懸念が高まっている。
会員推定はそのようなリスクを評価するための重要なツールであるが、既存の研究は主に、特定のサンプルまたはサンプルベースのデータユニットがトレーニングに使用されるかどうかに焦点を当てている。
LLMは特定のサンプルの動詞を記憶しないかもしれないが、実際の実体に関する知識を蓄積し、散在する言及から明らかにすることができる。
このアナロジーは、LLMを人間インタビュアーのように尋問して、エンティティ関連情報への露出を明らかにすることができるかどうかを調査する動機となる。
そこで本研究では,LLMトレーニングにおいて,対象エンティティに関連する情報が使用されているかどうかを判定するエンティティレベルのメンバシップ推論を提案する。
我々は,このタスクを,生成したテキストのみを観測可能な,実用的なラベルのみのブラックボックス設定で研究する。
我々は、手掛かり、入力、モデル制約の下でタスクを形式化し、その実現可能性に必要な十分な条件を確立し、この形式化に基づいて5つの尋問戦略をインスタンス化する。
戦略では、限定されたエンティティヒントを使用してプロンプトを構築し、エンティティ関連の応答を抽出し、生成されたテキストのセマンティックな特徴からメンバシップを推測する。
エンティティレベルのデータセットを構築し、最先端のサンプルレベルのラベルのみのメソッドをベースラインとしてエンティティレベルの設定に適用する。
個人による実験では,AUCを最大0.97まで達成し,最適な適応ベースラインに対して6.0%--17.5%のバランス精度が得られた。
関連論文リスト
- EL-MIA: Quantifying Membership Inference Risks of Sensitive Entities in LLMs [10.566053894405902]
我々は,LLMプライバシの文脈において,機密情報に着目した会員リスクのエンティティレベル発見という新たな課題を提案する。
既存のMIAの方法は、LLMトレーニングデータにすべてのプロンプトや文書が存在することを検知できるが、より細かい粒度でリスクを捕捉できない。
本研究では,MIA手法の評価のためのベンチマークデータセットを構築した。
論文 参考訳(メタデータ) (2025-10-31T18:50:47Z) - Contextual Integrity in LLMs via Reasoning and Reinforcement Learning [41.795843170879046]
我々は、文脈整合性を達成するために必要な理由をモデルに具現化する強化学習フレームワークを開発する。
本研究では,タスク性能を維持しながら,不適切な情報開示を大幅に低減することを示す。
論文 参考訳(メタデータ) (2025-05-29T21:26:21Z) - MoRE-LLM: Mixture of Rule Experts Guided by a Large Language Model [54.14155564592936]
大規模言語モデル(MoRE-LLM)によるルールエキスパートの混合を提案する。
MoRE-LLMは、トレーニング中の局所的なルールベースのサロゲートの発見と、それらの分類タスクの利用を操縦する。
LLMはルールを修正・コンテキスト化することで、ルールのドメイン知識の整合性を高める役割を担います。
論文 参考訳(メタデータ) (2025-03-26T11:09:21Z) - Latent Factor Models Meets Instructions: Goal-conditioned Latent Factor Discovery without Task Supervision [50.45597801390757]
Instruct-LFはゴール指向の潜在因子発見システムである。
命令フォロー機能と統計モデルを統合して、ノイズの多いデータセットを処理する。
論文 参考訳(メタデータ) (2025-02-21T02:03:08Z) - ReCaLL: Membership Inference via Relative Conditional Log-Likelihoods [56.073335779595475]
本稿ではReCaLL(Relative Conditional Log-Likelihood)を提案する。
実験の結果,非メンバープレフィックスの条件付きメンバーデータは,非メンバーデータと比較してログライクな傾向が著しく低下することがわかった。
我々は総合的な実験を行い、ReCaLLがWikiMIAデータセット上で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-06-23T00:23:13Z) - P-ICL: Point In-Context Learning for Named Entity Recognition with Large Language Models [7.037794031385439]
近年,大規模な言語モデル (LLM) の台頭により,実演サンプルを使わずに名前付きエンティティ認識 (NER) を直接実現できるようになった。
標準ICLは、LLMがタスク命令、フォーマット、入力ラベルマッピングを理解するのにのみ役立つが、NERタスク自体の特異性を無視する。
LLMでNERをよりよく実現するための新しいプロンプトフレームワークであるP-ICLを提案する。
論文 参考訳(メタデータ) (2024-05-08T11:01:21Z) - CLOMO: Counterfactual Logical Modification with Large Language Models [109.60793869938534]
本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。
LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文 参考訳(メタデータ) (2023-11-29T08:29:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。