論文の概要: What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media
- arxiv url: http://arxiv.org/abs/2606.06784v1
- Date: Fri, 05 Jun 2026 00:02:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.485748
- Title: What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media
- Title(参考訳): ソーシャルメディア上のユーザーレベルプライバシ漏洩のベンチマークとエージェントフレームワーク
- Authors: Zifan Peng, Yini Huang, Aiwen Lu, Qiming Ye, Peixian Zhang, Jingyi Zheng, Yule Liu, Xuechao Wang, Xinlei He, Jiaheng Wei,
- Abstract要約: パブリックなソーシャルメディア投稿は、テキスト、画像、メタデータに散らばる弱い手がかりを通じて、プライベートな情報を明らかにすることができる。
我々は、RednoteおよびInstagramアカウントのプライベートリファレンスコーパスから抽象化されたリークパターンによってガイドされる合成ベンチマークであるSopriBenchを提案する。
帰納的推論にインスパイアされたArgusは,累積リーク推論のためのトレーニング不要なエージェントフレームワークである。
- 参考スコア(独自算出の注目度): 14.75272852371927
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Public social media posts can reveal private information through weak cues scattered across text, images, or metadata. Such leakage is often cumulative and cross-post: cues that appear harmless in isolation may jointly expose a user's home, workplace, or routine. However, current research lacks a unified benchmark for user-level multimodal privacy leakage and an evaluation metric that captures exposure severity beyond binary accuracy. To address these gaps, we propose SopriBench, a synthetic benchmark guided by leakage patterns abstracted from a private reference corpus of Rednote and Instagram accounts, covering 50 user profiles and 1,569 images with attributes, contextual sensitivity, granularity, leakage type, inference difficulty, and supporting evidence. We further introduce the Privacy Exposure Score (PES), which weights value granularity by contextual sensitivity. Inspired by abductive reasoning, we introduce Argus, a training-free agentic framework for cumulative leakage inference. Argus forms hypotheses from accumulated evidence, verifies supporting evidence, and aggregates cross-post cues into privacy profiles, achieving 0.55 PES, a 25% improvement over the strongest baseline, with the largest gain on cross-post leakage.
- Abstract(参考訳): パブリックなソーシャルメディア投稿は、テキスト、画像、メタデータに散らばる弱い手がかりを通じて、プライベートな情報を明らかにすることができる。
このようなリークはしばしば累積的かつクロスポスト的であり、孤立して無害に見えるキューは、ユーザの家、職場、ルーチンを共同で露出する可能性がある。
しかし、現在の研究では、ユーザレベルのマルチモーダルプライバシーリークのための統一されたベンチマークと、バイナリの精度を超えた露出の重大度をキャプチャする評価基準が欠落している。
これらのギャップに対処するため、RednoteとInstagramのアカウントのプライベートリファレンスコーパスから抽象化されたリークパターンによってガイドされる合成ベンチマークであるSopriBenchを提案する。
さらに、文脈感度によって価値の粒度を重み付けするプライバシ・エクスポージャースコア(PES)を導入する。
帰納的推論にインスパイアされたArgusは,累積リーク推論のためのトレーニング不要なエージェントフレームワークである。
アーガスは蓄積された証拠から仮説を作成し、証拠を検証し、クロスポストの手がかりをプライバシープロファイルに集約し、最強のベースラインよりも25%改善し、クロスポストの漏洩で最大の利益を得た。
関連論文リスト
- Stop Tracking Me! Proactive Defense Against Attribute Inference Attack in LLMs [61.15237978606501]
大規模言語モデルは、ユーザ生成テキストからプライベートなユーザー属性を推測することができる。
既存の匿名化ベースの防御は粗く、プライバシーを優先する要素を匿名化する際に単語レベルの精度が欠如している。
細粒度匿名化(TRACE)と推論防止最適化(RPS)を組み合わせた統合防衛フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T03:37:50Z) - CanaryBench: Stress Testing Privacy Leakage in Cluster-Level Conversation Summaries [0.0]
CanaryBenchは、クラスタレベルの会話要約におけるプライバシー漏洩の簡易かつ再現可能なストレステストである。
CanaryBenchは、センシティブな識別子をシミュレートする秘密文字列(カナリア)を植え込んだ合成会話を生成する。
52個のカナリアクラスタ中50個のカナリアリークと非ゼロベースPIIインジケータ数について検討した。
論文 参考訳(メタデータ) (2026-01-25T20:30:37Z) - Privacy Collapse: Benign Fine-Tuning Can Break Contextual Privacy in Language Models [47.866853046761044]
トレーニングデータの多様で微妙なパターンは、コンテキストプライバシを低下させる可能性がある。
微調整されたモデルは、コンテキストプライバシの規範を推論する能力を失う。
この結果から, 現状の安全性評価に重大なギャップがあることが判明した。
論文 参考訳(メタデータ) (2026-01-21T17:53:06Z) - PrivacyBench: A Conversational Benchmark for Evaluating Privacy in Personalized AI [8.799432439533211]
AIエージェントはユーザのデジタルフットプリントへのアクセスに依存しており、プライベートメールやチャット、購入履歴からの機密データを含むことが多い。
このアクセスは、基本的な社会的およびプライバシーリスクを生み出します。
埋め込みシークレットを含む社会的基盤データセットを備えたベンチマークであるPrivacyBenchを紹介する。
論文 参考訳(メタデータ) (2025-12-31T13:16:45Z) - VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.68795949691009]
差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。
属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。
以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-09-22T20:57:48Z) - A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。
本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文 参考訳(メタデータ) (2025-04-28T01:16:27Z) - Quantifying Privacy Leakage in Split Inference via Fisher-Approximated Shannon Information Analysis [1.4972864129791565]
分割推論(SI)は、ディープニューラルネットワークを分散サブモデルに分割することで、プライバシ保護による協調学習を可能にする。
敵の攻撃防御ゲームに関する広範な研究にもかかわらず、プライバシーリスクの基本的な分析には欠点が残っている。
本稿では,情報理論を用いたプライバシー漏洩定量化の理論的枠組みを確立し,これを敵の確実性として定義し,平均ケースと最悪のエラー境界の両方を導出する。
論文 参考訳(メタデータ) (2025-04-14T09:19:06Z) - The Inadequacy of Similarity-based Privacy Metrics: Privacy Attacks against "Truly Anonymous" Synthetic Datasets [12.730435519914415]
実世界の合成データデプロイメントで使用されるプライバシメトリクスを調べ、その信頼性をいくつかの点で実証する。
ReconSynは、メトリクスによってプライベートと見なされるが、個々のレコードに固有の情報をリークする複数の合成データセットを生成するリコンストラクション攻撃である。
ReconSynは列車データから78-100%のアウトレーヤを復元し、ブラックボックスアクセスのみを1つの適合した生成モデルとプライバシメトリクスに含める。
論文 参考訳(メタデータ) (2023-12-08T15:42:28Z) - InfoScrub: Towards Attribute Privacy by Targeted Obfuscation [77.49428268918703]
視覚データに流出した個人情報を個人が制限できる技術について検討する。
我々はこの問題を新しい画像難読化フレームワークで解決する。
提案手法では,元の入力画像に忠実な難読化画像を生成するとともに,非難読化画像に対して6.2$times$(または0.85bits)の不確実性を増大させる。
論文 参考訳(メタデータ) (2020-05-20T19:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。