論文の概要: SharedRequest: Privacy-Preserving Model-Agnostic Inference for Large Language Models
- arxiv url: http://arxiv.org/abs/2606.05004v1
- Date: Wed, 03 Jun 2026 15:23:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.856837
- Title: SharedRequest: Privacy-Preserving Model-Agnostic Inference for Large Language Models
- Title(参考訳): SharedRequest: 大規模言語モデルに対するプライバシ保護モデル非依存推論
- Authors: Peihua Mai, Xuanrong Gao, Youlong Ding, Xianglong Du, Wei Liu, Yan Pang,
- Abstract要約: 本稿では,プライバシ保護を個別のプロンプトレベルではなくバッチレベルで再構成する,プライバシ保護推論のためのモデルに依存しないフレームワークを提案する。
SharedRequestは、従来の差分プライバシーベースラインに比べて20%以上高いユーティリティを実現していることを示す。
その共有プロンプト機構は、非バッチ推論と比較してクエリコストを最大5倍に削減する。
- 参考スコア(独自算出の注目度): 15.707683926526725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the widespread deployment of public large language models (LLMs) such as ChatGPT, protecting user prompt privacy has become an increasingly critical issue. Existing privacy-preserving inference methods sacrifice either utility or efficiency, and often require model-specific modifications that limit their compatibility. In this paper, we propose SharedRequest, a model-agnostic framework for privacy-preserving LLM inference that reformulates privacy protection at the batch level rather than the individual-prompt level. The key idea is to obscure sensitive information by mixing original prompts with noisy variants, while grouping semantically equivalent instructions to amortize the inference cost over a large batch of queries with minimal impact on LLM response quality. This design is independent of the LLM architecture, requiring no access to model parameters or architectural modification. Empirical results demonstrate that SharedRequest achieves over $20\%$ higher utility compared to prior differential privacy baselines, and its shared-prompt mechanism reduces query cost by up to $5\times$ compared to non-batched inference.
- Abstract(参考訳): ChatGPTのようなパブリックな大規模言語モデル(LLM)が広く展開されるにつれ、ユーザのプロンプトのプライバシ保護がますます重要になっている。
既存のプライバシ保護推論メソッドは、ユーティリティか効率のどちらかを犠牲にして、互換性を制限するモデル固有の修正を必要とすることが多い。
本稿では,プライバシ保護のためのモデルに依存しないLLM推論フレームワークであるSharedRequestを提案する。
キーとなるアイデアは、元のプロンプトをノイズのある変種と混合し、セマンティックに等価な命令をグループ化して、LLM応答品質に最小限の影響を与えることなく、大量のクエリに対して推論コストを償却することである。
この設計はLLMアーキテクチャとは独立しており、モデルパラメータやアーキテクチャの変更は不要である。
実証的な結果から、SharedRequestは従来の差分プライバシーベースラインよりも20\%以上高いユーティリティを実現しており、その共有プロンプトメカニズムは、非バッチ推論と比較してクエリコストを最大5\times$に削減する。
関連論文リスト
- Privacy-Preserving Mechanisms Enable Cheap Verifiable Inference of LLMs [33.54139088666698]
大規模言語モデル(LLM)は拡大を続けており、サードパーティホスティングサービスの利用が増加している。
既存の推論検証ツールは通常、ゼロ知識証明(ZKP)のような暗号の手法に依存している。
我々は、私的LLM推論を行う方法を考えると、限界余剰コストで検証された推論の形式を得ることができる新しい知見を開発する。
論文 参考訳(メタデータ) (2026-02-19T10:15:51Z) - Differentially Private and Communication Efficient Large Language Model Split Inference via Stochastic Quantization and Soft Prompt [33.701746954914135]
大規模言語モデル (LLM) は目覚ましい性能を達成し、かなりの研究関心を集めている。
既存のアプローチでは、送信前にトークンの埋め込みを難読化し、ローカルモデルを使ってデノナイズする方法が提案されている。
textbfDifferentially private and communication textbfEfficient textbfLLM split inference。
論文 参考訳(メタデータ) (2026-02-12T03:13:16Z) - Urania: Differentially Private Insights into AI Use [102.27238986985698]
$Urania$は、クラスタリング、パーティション選択、ヒストグラムベースの要約といったDPツールを活用することによって、エンドツーエンドのプライバシ保護を提供する。
結果は、厳密なユーザのプライバシを維持しながら、意味のある会話の洞察を抽出するフレームワークの能力を示している。
論文 参考訳(メタデータ) (2025-06-05T07:00:31Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - ConfusionPrompt: Practical Private Inference for Online Large Language Models [3.8134804426693094]
最先端の大規模言語モデル(LLM)は一般的にオンラインサービスとしてデプロイされ、ユーザーはクラウドサーバーに詳細なプロンプトを送信する必要がある。
我々は,従来のプロンプトを小さなサブプロンプトに分解することで,ユーザのプライバシを保護する,プライベートLLM推論のための新しいフレームワークであるConfusionPromptを紹介する。
コンフュージョンプロンプトは,オープンソースモデルと摂動に基づく手法を用いて,局所的推論手法よりもはるかに高い実用性を実現することを示す。
論文 参考訳(メタデータ) (2023-12-30T01:26:42Z) - A Randomized Approach for Tight Privacy Accounting [63.67296945525791]
推定検証リリース(EVR)と呼ばれる新しい差分プライバシーパラダイムを提案する。
EVRパラダイムは、まずメカニズムのプライバシパラメータを推定し、その保証を満たすかどうかを確認し、最後にクエリ出力を解放する。
我々の実証的な評価は、新たに提案されたEVRパラダイムが、プライバシ保護機械学習のユーティリティプライバシトレードオフを改善することを示している。
論文 参考訳(メタデータ) (2023-04-17T00:38:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。