論文の概要: LLM Anonymization Against Agentic Re-Identification
- arxiv url: http://arxiv.org/abs/2605.30848v2
- Date: Mon, 01 Jun 2026 17:13:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 18:24:16.848876
- Title: LLM Anonymization Against Agentic Re-Identification
- Title(参考訳): エージェント再同定に対するLDM匿名化
- Authors: Ziwen Li, Jianing Wen, Tianshi Li,
- Abstract要約: AURA (textbf Anonymization with textbfUtility-textbfRetention textbfAdaptation) は LLM ベースのtextitmask-reconstruct フレームワークである。
我々は,Web検索エージェントが行った再識別攻撃と,インタビュアーの注目する事実,コードブックの事実,および共同コンテキストのユーティリティグリッドに基づく実用性評価を用いて,実際のユーザインタビューテキスト上でのAURAを評価する。
- 参考スコア(独自算出の注目度): 7.3275169762993215
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic LLMs with web search change the threat model for text anonymization: weak contextual cues can become cross-referenceable evidence for re-identification, yet those same details also carry downstream analytic value of the text. Existing defenses either remove explicit identifiers, perturb text for formal privacy, or test rewritten text against non-web inference models, leaving underexplored the operating region between resistance to agentic web-search re-identification and utility retention. We introduce AURA (\textbf{A}nonymization with \textbf{U}tility-\textbf{R}etention \textbf{A}daptation), an LLM-powered \textit{mask-reconstruct} framework that decouples privacy localization from utility-preserving reconstruction and selects candidates with adversarial privacy and utility-retention checks. We evaluate AURA on real-user interview transcripts using re-identification attacks carried out by web-search agents, along with a utility evaluation based on interviewee-profile facts, codebook facts, and the joint contextual utility grid. Our results show that AURA improves the privacy-utility frontier by using adaptive privacy scope to strengthen resistance to agentic re-identification and using a mask-reconstruct anonymization method to better preserve contextual utility under fixed privacy scope.
- Abstract(参考訳): Web検索によるエージェントLLMは、テキスト匿名化の脅威モデルを変化させる: 弱い文脈的手がかりは、再識別のための相互参照可能な証拠となり得るが、同じ詳細は、テキストの下流解析値も持つ。
既存の防衛は、明示的な識別子を削除するか、正式なプライバシーのために混乱したテキストを削除するか、あるいは非Web推論モデルに対して書き直されたテキストをテストするかのいずれかであり、エージェントによるWeb検索の再識別とユーティリティ保持に対する抵抗の間の動作領域を過小評価した。
本稿では,ALUA (\textbf{A}nonymization with \textbf{U}tility-\textbf{R}etention \textbf{A}daptation) を導入する。
我々は,Web検索エージェントによる再識別攻撃と,インタビュアーの注目する事実,コードブックの事実,および共同コンテキストのユーティリティグリッドに基づく実用性評価を用いて,実際のユーザインタビューテキスト上でのAURAを評価する。
以上の結果から,AURAは適応型プライバシスコープを用いて,エージェントの再識別に対する抵抗を強化するとともに,マスク再構成匿名化手法を用いて,固定されたプライバシスコープ下でのコンテキスト的ユーティリティの保存を改善することにより,プライバシユーティリティフロンティアの改善を図っている。
関連論文リスト
- From Weak Cues to Real Identities: Evaluating Inference-Driven De-Anonymization in LLM Agents [15.933650066248648]
LLMをベースとしたエージェントは、散在する個別に特定されていない手がかりから、現実世界のアイデンティティを自律的に再構築することができる。
我々は、この脅威をインセンス駆動リンクとして確立し、3つの設定で体系的に評価する。
Netflix Prizeの設定では、エージェントは79.2%のアイデンティティを再構築し、56.0%の古典的ベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2026-03-19T00:59:26Z) - Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。
トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。
IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-28T09:28:12Z) - Zero-Shot Privacy-Aware Text Rewriting via Iterative Tree Search [60.197239728279534]
クラウドベースのサービスにおける大規模言語モデル(LLM)は、重大なプライバシー上の懸念を引き起こしている。
既存のテキスト匿名化と、ルールベースのリアクションやスクラブのような非識別技術は、プライバシー保護とテキストの自然性と実用性のバランスをとるのに苦労することが多い。
我々は,一貫性,妥当性,自然性を保ちながら,秘密情報を体系的に難読化・削除するゼロショット木探索型反復文書き換えアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-09-25T07:23:52Z) - VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.68795949691009]
差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。
属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。
以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-09-22T20:57:48Z) - The Double-edged Sword of LLM-based Data Reconstruction: Understanding and Mitigating Contextual Vulnerability in Word-level Differential Privacy Text Sanitization [53.51921540246166]
我々は,言語大モデル (LLM) がDP対応テキストの文脈的脆弱性を活用可能であることを示す。
LLM再建の二重刃剣効果がプライバシーと実用性に与える影響を実験的に明らかにした。
本稿では,データ再構成を後処理のステップとして使用するための推奨事項を提案する。
論文 参考訳(メタデータ) (2025-08-26T12:22:45Z) - Tau-Eval: A Unified Evaluation Framework for Useful and Private Text Anonymization [7.9049991577473735]
本稿では,テキスト匿名化手法をベンチマークするオープンソースフレームワークであるTau-Evalを紹介する。
Pythonライブラリ、コード、ドキュメント、チュートリアルが公開されている。
論文 参考訳(メタデータ) (2025-06-06T10:59:35Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
機密情報を含む匿名化は、幅広いアプリケーションにとって不可欠である。
既存の技術は、大規模言語モデルの再識別能力の新たな課題に直面している。
本稿では,プライバシ評価器,ユーティリティ評価器,最適化コンポーネントの3つの重要なコンポーネントで構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization [8.483679748399037]
IncogniTextは,テキストを匿名化して潜在的敵を誤認し,誤った属性値を予測する手法である。
実証評価の結果,8種類の属性に対して,プライベート属性リークが90%以上減少していることがわかった。
論文 参考訳(メタデータ) (2024-07-03T09:49:03Z) - Unsupervised Text Deidentification [101.2219634341714]
個人識別情報を漏洩する単語を隠蔽する教師なしの識別手法を提案する。
K匿名性に基づくプライバシによって動機づけられた私たちは、最小の再識別ランクを保証するリアクションを生成します。
論文 参考訳(メタデータ) (2022-10-20T18:54:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。