論文の概要: PromptPrint: Behavioral Biometrics Through Natural Language Prompting in LLMs
- arxiv url: http://arxiv.org/abs/2606.06755v1
- Date: Thu, 04 Jun 2026 22:34:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.470476
- Title: PromptPrint: Behavioral Biometrics Through Natural Language Prompting in LLMs
- Title(参考訳): PromptPrint: LLMにおける自然言語プロンプトによる行動バイオメトリックス
- Authors: Shaiv Patel, Kartik Narayan, Vishal Patel,
- Abstract要約: 著者帰属研究は伝統的に長文、表現力のあるテキストに焦点を合わせてきた。
本稿では,ユーザの習慣的語彙,構文,談話パターンが学習可能な行動バイオメトリックを形成するという仮説であるPromptPrintを紹介する。
- 参考スコア(独自算出の注目度): 3.400967062338203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Authorship attribution research has traditionally focused on long-form, expressive texts; however, interactions with large language models (LLMs) are typically brief and task-driven prompts. This raises a fundamental question: do such prompts contain a stable, author-identifiable, and distinctive signal? We introduce PromptPrint, a systematic study of prompt-based identity, the hypothesis that a user's habitual vocabulary, syntax, and discourse patterns form a learnable behavioral biometric. Using 20,680 real prompts from 1,034 users, we establish three key findings. First, lexical representations significantly outperform semantic encoders, supporting the "lexical stability hypothesis": identity is primarily encoded in surface-level word choice rather than abstract intent. Second, stylometric features exhibit a "uniqueness-consistency paradox": users are highly distinctive across the population, yet behaviorally inconsistent across contexts. Third, adversarial analysis reveals a clear vulnerability spectrum: identity signals are robust to minor lexical perturbations but degrade substantially under semantic paraphrasing. Overall, our results demonstrate strong identification performance at scale, establishing prompt-based identity as a viable behavioral biometric. This work introduces a new perspective on user modeling in LLM interactions, with important implications for security and privacy. Data and code will be released upon the acceptance of our work.
- Abstract(参考訳): 著者帰属研究は伝統的に長文で表現力のあるテキストに焦点を合わせてきたが、大きな言語モデル(LLM)との相互作用は通常、簡潔でタスク駆動のプロンプトである。
このようなプロンプトには、安定で、著者が特定可能な、独特な信号が含まれていますか?
本稿では,プロンプトプリント(PromptPrint)を提案する。プロンプトプリント(PromptPrint)は,ユーザの習慣的語彙,構文,談話パターンが学習可能な行動バイオメトリックを形成するという仮説である。
1,034名のユーザから20,680名の真のプロンプトを用いて,3つの重要な結果が得られた。
まず、語彙表現は意味論的エンコーダを著しく上回り、「語彙的安定性仮説」を支持する。
第二に、スタイリスティックな特徴は「一意-一貫性のパラドックス」を示しており、利用者は人口間で非常に独特であるが、状況によっては行動的に矛盾している。
識別信号は小さな語彙の摂動に対して頑健であるが、意味的言い換えでは著しく劣化する。
全体として,本研究の結果は,行動バイオメトリックとして即時識別が確立されるなど,大規模に強力な識別性能を示すものである。
この研究は、LLMインタラクションにおけるユーザーモデリングに関する新しい視点を導入し、セキュリティとプライバシに重要な意味を持つ。
作業が受理されれば、データとコードはリリースされます。
関連論文リスト
- Linguistic Indicators of Early Cognitive Decline in the DementiaBank Pitt Corpus: A Statistical and Machine Learning Study [4.417564179511245]
本研究では,3つの言語表現を用いて,DementiaBank Pitt Corpusからの自発音声の書き起こしを分析する。
構文的および文法的特徴は、語彙内容が欠如していても、強力な識別力を保持する。
本研究は,透明で信頼性の高い言語ベース認知スクリーニングにおける言語基盤機能の利用を支援する。
論文 参考訳(メタデータ) (2026-02-11T16:53:57Z) - Ask, Answer, and Detect: Role-Playing LLMs for Personality Detection with Question-Conditioned Mixture-of-Experts [4.618735978506653]
ROMEは、心理的知識を人格検出に明示的に注入する新しいフレームワークである。
ROMEは、実世界の2つのデータセットの実験において、最先端のベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-12-09T17:07:54Z) - Unveiling Intrinsic Dimension of Texts: from Academic Abstract to Creative Story [6.189667549402578]
内在次元(ID)は現代のLLM解析において重要なツールである。
我々は、解釈可能なテキストプロパティにおいて、最初の総合的な研究基盤IDを提供する。
論文 参考訳(メタデータ) (2025-11-19T08:00:40Z) - See What You Seek: Semantic Contextual Integration for Cloth-Changing Person Re-Identification [14.01260112340177]
衣服交換者再識別(CC-ReID)は、衣服の変化にもかかわらず、監視カメラを通して個人をマッチングすることを目的としている。
既存の方法は通常、衣服の変化の影響を軽減するか、アイデンティティ(ID)関連の特徴を強化する。
本稿では,衣服による相違を低減し,IDの質を高めるために,新しいプロンプト学習フレームワークSemantic Contextual Integration(SCI)を提案する。
論文 参考訳(メタデータ) (2024-12-02T10:11:16Z) - Complex systems approach to natural language [0.0]
複雑性科学の観点から、自然言語の研究で使用される主要な方法論概念を概説する。
定量的言語学における3つの主要な複雑性関連研究動向を概説する。
論文 参考訳(メタデータ) (2024-01-05T12:01:26Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。