論文の概要: Synopsis: Secure and private trend inference from encrypted semantic embeddings
- arxiv url: http://arxiv.org/abs/2505.23880v1
- Date: Thu, 29 May 2025 17:34:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.598595
- Title: Synopsis: Secure and private trend inference from encrypted semantic embeddings
- Title(参考訳): 要約:暗号化されたセマンティック埋め込みからのセキュアでプライベートなトレンド推論
- Authors: Madelyne Xiao, Palak Jain, Micha Gorelick, Sarah Scheffler,
- Abstract要約: 本稿では,メッセージ埋め込みを用いた協調型E2EEメッセージにおけるメッセージトレンド分析のためのセキュアなアーキテクチャであるSynopsisを紹介する。
このシステムの目的は調査ジャーナリズムであるため、Synopsisは探索的分析と目標分析の両方を促進する必要がある。
ヒンディー語のWhatsAppメッセージのデータセットによる評価は、我々のアプローチの効率性と正確性を示している。
- 参考スコア(独自算出の注目度): 2.7998963147546148
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: WhatsApp and many other commonly used communication platforms guarantee end-to-end encryption (E2EE), which requires that service providers lack the cryptographic keys to read communications on their own platforms. WhatsApp's privacy-preserving design makes it difficult to study important phenomena like the spread of misinformation or political messaging, as users have a clear expectation and desire for privacy and little incentive to forfeit that privacy in the process of handing over raw data to researchers, journalists, or other parties. We introduce Synopsis, a secure architecture for analyzing messaging trends in consensually-donated E2EE messages using message embeddings. Since the goal of this system is investigative journalism workflows, Synopsis must facilitate both exploratory and targeted analyses -- a challenge for systems using differential privacy (DP), and, for different reasons, a challenge for private computation approaches based on cryptography. To meet these challenges, we combine techniques from the local and central DP models and wrap the system in malicious-secure multi-party computation to ensure the DP query architecture is the only way to access messages, preventing any party from directly viewing stored message embeddings. Evaluations on a dataset of Hindi-language WhatsApp messages (34,024 messages represented as 500-dimensional embeddings) demonstrate the efficiency and accuracy of our approach. Queries on this data run in about 30 seconds, and the accuracy of the fine-grained interface exceeds 94% on benchmark tasks.
- Abstract(参考訳): WhatsAppや他の多くの一般的な通信プラットフォームは、エンドツーエンド暗号化(E2EE)を保証する。
WhatsAppのプライバシー保護設計は、誤った情報や政治的メッセージの拡散のような重要な現象を研究するのを難しくしている。
本稿では,メッセージ埋め込みを用いた協調型E2EEメッセージにおけるメッセージトレンド分析のためのセキュアなアーキテクチャであるSynopsisを紹介する。
このシステムのゴールは調査ジャーナリズムのワークフローであるため、Synopsisは探索的分析とターゲット分析の両方を促進する必要がある -- 差分プライバシー(DP)を用いたシステムの課題であり、さまざまな理由から、暗号化に基づくプライベートな計算アプローチの課題である。
これらの課題に対処するため、我々は、ローカルおよび中央のDPモデルからのテクニックを組み合わせて、悪意のあるセキュアなマルチパーティ計算でシステムをラップし、DPクエリアーキテクチャがメッセージにアクセスする唯一の方法であることを保証する。
ヒンディー語のWhatsAppメッセージ(500次元埋め込みで表される34,024メッセージ)のデータセットによる評価は、我々のアプローチの効率性と正確性を示している。
このデータのクエリは約30秒で実行され、詳細なインターフェースの精度は、ベンチマークタスクで94%を超える。
関連論文リスト
- Metadata-private Messaging without Coordination [20.481776420813915]
PingPongは、メタデータプライベートメッセージングのためのエンドツーエンドシステムである。
厳格な"ダイアル・バイ・コンバース"パラダイムを、より柔軟な"通知・バイ・レトリーバル"ワークフローに置き換えるものだ。
Pongは、現代のインスタントメッセージングシステムに似た、ユーザビリティのレベルを達成する。
論文 参考訳(メタデータ) (2025-04-28T08:21:16Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - NAP^2: A Benchmark for Naturalness and Privacy-Preserving Text Rewriting by Learning from Human [56.46355425175232]
我々は,人間によって使用される2つの共通戦略を用いて,機密テキストの衛生化を提案する。
我々は,クラウドソーシングと大規模言語モデルの利用を通じて,NAP2という最初のコーパスをキュレートする。
匿名化に関する以前の研究と比較すると、人間に触発されたアプローチはより自然な書き直しをもたらす。
論文 参考訳(メタデータ) (2024-06-06T05:07:44Z) - IDPFilter: Mitigating Interdependent Privacy Issues in Third-Party Apps [0.30693357740321775]
サードパーティアプリがIDP(Interdependent Privacy)への懸念を強めている
本報告では,サードパーティアプリのIDP問題に関して,これまで未検討であった問題を包括的に調査する。
IDPFilterは,アプリケーションプロバイダが情報収集を最小化するためのプラットフォームに依存しないAPIである。
論文 参考訳(メタデータ) (2024-05-02T16:02:13Z) - EmojiPrompt: Generative Prompt Obfuscation for Privacy-Preserving Communication with Cloud-based LLMs [34.77734655124251]
EmojiPromptは生成変換を行い、言語的および非言語的要素を持つプロンプト内でプライベートデータを難読化する。
さまざまなドメインから8つのデータセットにまたがるEmojiPromptの性能を評価した。
EmojiPromptの原子レベルの難読化により、クラウドベースのLCMでのみ機能する。
論文 参考訳(メタデータ) (2024-02-08T17:57:11Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - "Am I Private and If So, how Many?" -- Using Risk Communication Formats
for Making Differential Privacy Understandable [0.0]
我々は、差別化プライバシのプライバシリスクモデルと合わせて、リスクコミュニケーションフォーマットを適応する。
我々はこれらの新しいプライバシーコミュニケーションフォーマットをクラウドソーシング研究で評価する。
論文 参考訳(メタデータ) (2022-04-08T13:30:07Z) - BeeTrace: A Unified Platform for Secure Contact Tracing that Breaks Data
Silos [73.84437456144994]
接触追跡は、新型コロナウイルスなどの感染症の拡散を制御する重要な方法である。
現在のソリューションでは、ビジネスデータベースや個々のデジタルデバイスに格納された大量のデータを利用できません。
データサイロを破り、プライバシーの目標を保証するために最先端の暗号化プロトコルをデプロイする統合プラットフォームであるBeeTraceを提案する。
論文 参考訳(メタデータ) (2020-07-05T10:33:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。