論文の概要: From Weak Cues to Real Identities: Evaluating Inference-Driven De-Anonymization in LLM Agents
- arxiv url: http://arxiv.org/abs/2603.18382v1
- Date: Thu, 19 Mar 2026 00:59:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.894255
- Title: From Weak Cues to Real Identities: Evaluating Inference-Driven De-Anonymization in LLM Agents
- Title(参考訳): 弱みから真のアイデンティティ: LLMエージェントにおける推論駆動の匿名化の評価
- Authors: Myeongseob Ko, Jihyun Jeong, Sumiran Singh Thakur, Gyuhak Kim, Ruoxi Jia,
- Abstract要約: LLMをベースとしたエージェントは、散在する個別に特定されていない手がかりから、現実世界のアイデンティティを自律的に再構築することができる。
我々は、この脅威をインセンス駆動リンクとして確立し、3つの設定で体系的に評価する。
Netflix Prizeの設定では、エージェントは79.2%のアイデンティティを再構築し、56.0%の古典的ベースラインを著しく上回っている。
- 参考スコア(独自算出の注目度): 15.933650066248648
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anonymization is widely treated as a practical safeguard because re-identifying anonymous records was historically costly, requiring domain expertise, tailored algorithms, and manual corroboration. We study a growing privacy risk that may weaken this barrier: LLM-based agents can autonomously reconstruct real-world identities from scattered, individually non-identifying cues. By combining these sparse cues with public information, agents resolve identities without bespoke engineering. We formalize this threat as \emph{inference-driven linkage} and systematically evaluate it across three settings: classical linkage scenarios (Netflix and AOL), \emph{InferLink} (a controlled benchmark varying task intent, shared cues, and attacker knowledge), and modern text-rich artifacts. Without task-specific heuristics, agents successfully execute both fixed-pool matching and open-ended identity resolution. In the Netflix Prize setting, an agent reconstructs 79.2\% of identities, significantly outperforming a 56.0\% classical baseline. Furthermore, linkage emerges not only under explicit adversarial prompts but also as a byproduct of benign cross-source analysis in \emph{InferLink} and unstructured research narratives. These findings establish that identity inference -- not merely explicit information disclosure -- must be treated as a first-class privacy risk; evaluations must measure what identities an agent can infer.
- Abstract(参考訳): 匿名化は、歴史的に匿名記録の再識別にはコストがかかり、ドメインの専門知識、調整されたアルゴリズム、手動の腐食が必要だったため、事実上の安全策として広く扱われた。
LLMをベースとしたエージェントは、散らばった個々の非識別の手がかりから、現実世界のアイデンティティを自律的に再構築することができる。
これらのスパースキューを公開情報と組み合わせることで、エージェントは造形工学を使わずにアイデンティティを解決できる。
我々は、この脅威を‘emph{inference-driven linkage’として形式化し、古典的なリンクシナリオ(NetflixとAOL)、‘emph{InferLink}(さまざまなタスクインテント、共有キュー、攻撃的知識)、モダンなテキストリッチなアーティファクトの3つの設定で体系的に評価する。
タスク固有のヒューリスティックがなければ、エージェントは固定プールマッチングとオープンエンドID解決の両方をうまく実行する。
Netflix Prizeの設定では、エージェントは79.2\%のアイデンティティを再構築し、56.0\%の古典的ベースラインを著しく上回っている。
さらに、リンクは明示的な敵対的プロンプトだけでなく、 \emph{InferLink} や非構造化研究物語における良質なクロスソース分析の副産物として現れる。
これらの知見は、ID推論は、単に明示的な情報開示ではなく、第一級のプライバシーリスクとして扱われなければならないことを証明している。
関連論文リスト
- RAT-Bench: A Comprehensive Benchmark for Text Anonymization [8.64925947747086]
我々は、再識別リスクに基づいたテキスト匿名化ツールのベンチマークであるRAT-Benchを紹介する。
ドメイン,言語,難易度にまたがる様々な直接的および間接的識別子を含む合成テキストを生成する。
機能は大きく異なるが、最高のツールでさえ、特にダイレクト識別子が標準的な方法で書かれていない場合、完璧には程遠い。
論文 参考訳(メタデータ) (2026-02-13T10:41:44Z) - Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。
トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。
IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-28T09:28:12Z) - Searching for Privacy Risks in LLM Agents via Simulation [61.229785851581504]
本稿では,プライバシクリティカルなエージェントインタラクションのシミュレーションを通じて,攻撃と防御戦略の改善を交互に行う検索ベースのフレームワークを提案する。
攻撃戦略は、直接の要求から、不正行為や同意偽造といった高度な戦術へとエスカレートする。
発見された攻撃と防御は、さまざまなシナリオやバックボーンモデルにまたがって伝達され、プライバシーに配慮したエージェントを構築するための強力な実用性を示している。
論文 参考訳(メタデータ) (2025-08-14T17:49:09Z) - AgentStealth: Reinforcing Large Language Model for Anonymizing User-generated Text [8.758843436588297]
AgentStealthは、テキスト匿名化のための自己強化言語モデルである。
本手法は, 匿名化の有効性と実用性の両方において, ベースラインよりも優れていることを示す。
当社の軽量設計は、エッジデバイスへの直接的なデプロイをサポートし、クラウド依存や通信ベースのプライバシリスクを回避する。
論文 参考訳(メタデータ) (2025-06-26T02:48:16Z) - Automated Profile Inference with Language Model Agents [67.32226960040514]
自動プロファイル推論(Automatic Profile Inference)と呼ばれる,LLMがオンラインの偽名にもたらす新たな脅威について検討する。
相手は、LDMに対して、疑似プラットフォーム上で公開されているユーザアクティビティから、機密性の高い個人属性を自動的に取り除き、抽出するように指示することができる。
実世界のシナリオにおけるこのような脅威の可能性を評価するために,AutoProfilerという自動プロファイリングフレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-18T13:05:17Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
機密情報を含む匿名化は、幅広いアプリケーションにとって不可欠である。
既存の技術は、大規模言語モデルの再識別能力の新たな課題に直面している。
本稿では,プライバシ評価器,ユーティリティ評価器,最適化コンポーネントの3つの重要なコンポーネントで構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - Disentangle Before Anonymize: A Two-stage Framework for Attribute-preserved and Occlusion-robust De-identification [55.741525129613535]
匿名化前の混乱」は、新しい二段階フレームワーク(DBAF)である
このフレームワークには、Contrastive Identity Disentanglement (CID)モジュールとKey-authorized Reversible Identity Anonymization (KRIA)モジュールが含まれている。
大規模な実験により,本手法は最先端の非識別手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-11-15T08:59:02Z) - Statistical anonymity: Quantifying reidentification risks without
reidentifying users [4.103598036312231]
データ匿名化は、参加者の再識別を防ぐためのプライバシ保護データリリースに対するアプローチである。
リリースされたデータに$k$匿名を強制するための既存のアルゴリズムは、匿名化を実行するキュレーターが元のデータに完全にアクセスできることを前提としている。
本稿では,キュレーターに置かれなければならない信頼を減らすためのアイデアについて検討するが,それでも$k$匿名性の統計的概念は維持されている。
論文 参考訳(メタデータ) (2022-01-28T18:12:44Z) - No Intruder, no Validity: Evaluation Criteria for Privacy-Preserving
Text Anonymization [0.48733623015338234]
自動テキスト匿名化システムを開発する研究者や実践者は,その評価手法が,個人を再同定から保護するシステムの能力に本当に反映しているかどうかを慎重に評価すべきである。
本稿では,匿名化手法の技術的性能,匿名化による情報損失,不正文書の非匿名化能力を含む評価基準のセットを提案する。
論文 参考訳(メタデータ) (2021-03-16T18:18:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。