論文の概要: Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents
- arxiv url: http://arxiv.org/abs/2605.06232v1
- Date: Thu, 07 May 2026 13:21:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.838309
- Title: Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents
- Title(参考訳): ペニーのプロファイリング: LLMエージェントのプライバシアイスバーグを公開
- Authors: Jiahao Chen, Qi Zhang, Ruixiao Lin, Chunyi Zhou, Tianyu Du, Qingming Li, Tong Zhang, Junhao Li, Yuwen Pu, Shouling Ji,
- Abstract要約: 我々は人間の意識のレンズを通して現実世界におけるプライバシーの認識を調査する。
我々は、現実世界の人間のプライバシーリスクを3段階に分類するPrivacyIcebergを提案する。
- 参考スコア(独自算出の注目度): 52.02752011119451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have revolutionized how information are collected, aggregated, and reasoned. However, this enables a novel and accessible vector of privacy intrusion: the automated and in-depth personal profiling; this engenders a chilling effect of "peepers everywhere". Existing research primarily unfolds from the training pipeline of LLM, emphasizing the exposure of Personally Identifiable Information (PII) through memorization, while privacy studies from a human-centric perspective remain underexplored. To fill this void, we empirically investigate privacy perception in the real world through the lens of human awareness and the practices of LLM-integrated platforms, revealing a significant dissonance: platforms fail to technically or policy-wise address public privacy concerns. To facilitate a systematic and quantifiable study of privacy risk, we propose the PrivacyIceberg, which categorizes real-world human privacy risks into three tiers: explicitly searched, contextually inferred, and deeply aggregated, based on the sophistication of LLM exploitation. We developed IcebergExplorer to audit privacy exposure, utilizing minimal PII as a search seed to reconstruct high-fidelity profiles, achieving over 90% factual accuracy within 10 minutes at a cost under $3, for real-world scenarios. Additionally, we identify six root causes contributing to such privacy disclosures and propose multi-stakeholder countermeasures for LLM vendors, individuals, and data publishers.
- Abstract(参考訳): 大規模言語モデル(LLM)は、情報の収集、集約、推論方法に革命をもたらした。
しかし、これは、新しい、アクセス可能なプライバシー侵害のベクトル、すなわち、自動化された、奥深くの個人プロファイリングを可能にする。
既存の研究は主にLLMのトレーニングパイプラインから展開され、暗記を通じてPII(Personally Identible Information)の露出を強調している。
この空白を埋めるために、人間の認識とLLM統合プラットフォームの実践を通して現実世界のプライバシーの認識を実証的に調査し、プラットフォームが技術的または政策的に公共のプライバシー問題に対処できないという大きな不協和性を明らかにします。
プライバシリスクのシステマティックかつ定量的な研究を容易にするために,LLM活用の高度化に基づいて,現実の人間のプライバシリスクを明示的に検索し,文脈的に推測し,深く集約した3つの階層に分類するPrivacyIcebergを提案する。
我々はIcebergExplorerを開発し、プライバシの露出を監査し、最小限のPIIを検索シードとして利用して高忠実度プロファイルを再構築し、現実世界のシナリオに対して3ドル以下のコストで10分以内で90%以上の事実精度を達成した。
さらに、このようなプライバシー開示に寄与する6つの根本原因を特定し、LLMベンダー、個人、データパブリッシャに対するマルチステークホルダ対策を提案する。
関連論文リスト
- Position: Privacy Is Not Just Memorization! [10.200402835229552]
このポジションペーパーでは、Large Language Modelsのプライバシの展望は、データ抽出のトレーニングをはるかに超えている、と論じている。
我々は、データ収集からデプロイメントまで、LCMライフサイクル全体にわたるプライバシーリスクの包括的分類を提示する。
私たちは、研究コミュニティがLLMプライバシにどのようにアプローチするかを根本的に変えて、現在の技術的なソリューションの焦点を狭くすることを求めます。
論文 参考訳(メタデータ) (2025-10-02T04:02:06Z) - LLM-as-a-Judge for Privacy Evaluation? Exploring the Alignment of Human and LLM Perceptions of Privacy in Textual Data [47.76073133338117]
プライバシ-自然言語処理(NLP)分野の進歩にもかかわらず、プライバシの正確な評価は依然として課題である。
テキストデータにおけるプライバシ評価モデルであるsox2013$にインスパイアされたグローバルアプローチを提案する。
以上の結果から,プライバシ評価者としての評価者の可能性を探究する道が開けた。
論文 参考訳(メタデータ) (2025-08-16T20:49:41Z) - SoK: The Privacy Paradox of Large Language Models: Advancements, Privacy Risks, and Mitigation [9.414685411687735]
大型言語モデル(LLM)は、機械が顕著な精度で人間に似たテキストを生成することができる高度な人工知能システムである。
本稿では, LLMにおけるプライバシーの包括的分析を行い, 課題を4つの主要領域に分類する。
提案するプライバシ課題を対象として,既存の緩和メカニズムの有効性と限界を評価し,さらなる研究を行うための領域を特定する。
論文 参考訳(メタデータ) (2025-06-15T03:14:03Z) - PrivaCI-Bench: Evaluating Privacy with Contextual Integrity and Legal Compliance [44.287734754038254]
生成型大規模言語モデル(LLM)のコンテキストプライバシ評価ベンチマークであるPrivaCI-Benchを提案する。
本稿では,最近の推論モデルQwQ-32BとDeepseek R1を含む最新のLCMを評価した。
実験の結果、LLMは特定のコンテキスト内で重要なCIパラメータを効果的にキャプチャできるが、プライバシコンプライアンスのさらなる進歩が必要であることが示唆された。
論文 参考訳(メタデータ) (2025-02-24T10:49:34Z) - Multi-P$^2$A: A Multi-perspective Benchmark on Privacy Assessment for Large Vision-Language Models [65.2761254581209]
LVLM(Large Vision-Language Models)21個のオープンソースと2個のクローズドソースのプライバシ保護機能の評価を行った。
Multi-P$2$Aに基づいて、21のオープンソースと2つのクローズドソースLVLMのプライバシ保護機能を評価する。
以上の結果から,現在のLVLMは一般にプライバシー侵害のリスクが高いことが明らかとなった。
論文 参考訳(メタデータ) (2024-12-27T07:33:39Z) - PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。