論文の概要: Privacy Guard & Token Parsimony by Prompt and Context Handling and LLM Routing
- arxiv url: http://arxiv.org/abs/2603.28972v1
- Date: Mon, 30 Mar 2026 20:16:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.77174
- Title: Privacy Guard & Token Parsimony by Prompt and Context Handling and LLM Routing
- Title(参考訳): プロンプトとコンテキストハンドリングとLCMルーティングによるプライバシガードとトークンパシモニー
- Authors: Alessio Langiu,
- Abstract要約: プロンプトを集中サブタスクに分解し、Zero-TrustまたはNDAがカバーするモデルにハイリスククエリを再ルーティングする。
この二重メカニズムは、機密推論ベクトル(Zero Leakage)を同時に排除し、クラウドトークンペイロード(OpEx Reduction)を削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The large-scale adoption of Large Language Models (LLMs) forces a trade-off between operational cost (OpEx) and data privacy. Current routing frameworks reduce costs but ignore prompt sensitivity, exposing users and institutions to leakage risks towards third-party cloud providers. We formalise the "Inseparability Paradigm": advanced context management intrinsically coincides with privacy management. We propose a local "Privacy Guard" -- a holistic contextual observer powered by an on-premise Small Language Model (SLM) -- that performs abstractive summarisation and Automatic Prompt Optimisation (APO) to decompose prompts into focused sub-tasks, re-routing high-risk queries to Zero-Trust or NDA-covered models. This dual mechanism simultaneously eliminates sensitive inference vectors (Zero Leakage) and reduces cloud token payloads (OpEx Reduction). A LIFO-based context compacting mechanism further bounds working memory, limiting the emergent leakage surface. We validate the framework through a 2x2 benchmark (Lazy vs. Expert users; Personal vs. Institutional secrets) on a 1,000-sample dataset, achieving a 45% blended OpEx reduction, 100% redaction success on personal secrets, and -- via LLM-as-a-Judge evaluation -- an 85% preference rate for APO-compressed responses over raw baselines. Our results demonstrate that Token Parsimony and Zero Leakage are mathematically dual projections of the same contextual compression operator.
- Abstract(参考訳): 大規模言語モデル(LLM)の大規模採用は、運用コスト(OpEx)とデータプライバシのトレードオフを強いる。
現在のルーティングフレームワークはコストを削減しているが、迅速な感度を無視し、ユーザや機関がサードパーティのクラウドプロバイダに対して漏洩するリスクを露呈する。
先進的な文脈管理は本質的にプライバシ管理と一致する。
本稿では,SLM(Small Language Model)をベースとした局所的コンテキストオブザーバであるPrivacy Guardを提案する。これは抽象的な要約と自動プロンプト最適化(Automatic Prompt Optimisation,APO)を行い,プロンプトを集中したサブタスクに分解し,Zero-TrustやNDAがカバーするモデルに高リスククエリを再ルーティングする。
この二重メカニズムは、機密推論ベクトル(Zero Leakage)を同時に排除し、クラウドトークンペイロード(OpEx Reduction)を削減する。
LIFOベースのコンテキスト圧縮機構は、さらに作業メモリをバウンドし、創発リーク面を制限する。
2x2ベンチマーク(Lazy vs. Expertユーザ、Personal vs. Institutional Secrets)を1,000サンプルのデータセット上で実施し、OpExのブレンドによる45%の削減、個人のシークレットに対する100%のリアクション成功、そして-LLM-as-a-Judge評価 -- によって、生のベースラインよりもAPO圧縮レスポンスの85%の優先レートを実現しました。
この結果から,Token Parsimony と Zero Leakage は数学的に同じ文脈圧縮作用素の二重射影であることがわかった。
関連論文リスト
- Your Inference Request Will Become a Black Box: Confidential Inference for Cloud-based Large Language Models [39.390624817461905]
Talariaは、クライアントデータを保護するためにLarge Language Modelsパイプラインを分割する機密推論フレームワークである。
Talariaは、クライアントが制御するConfidential Virtual Machine内で、機密で重量に依存しない操作を実行する。
タラリアは最先端のトークン推論攻撃に対して防御でき、トークン再構成の精度は97.5%以上から平均1.34%まで低下する。
論文 参考訳(メタデータ) (2026-02-27T06:37:07Z) - Stop Tracking Me! Proactive Defense Against Attribute Inference Attack in LLMs [61.15237978606501]
大規模言語モデルは、ユーザ生成テキストからプライベートなユーザー属性を推測することができる。
既存の匿名化ベースの防御は粗く、プライバシーを優先する要素を匿名化する際に単語レベルの精度が欠如している。
細粒度匿名化(TRACE)と推論防止最適化(RPS)を組み合わせた統合防衛フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T03:37:50Z) - Ad Insertion in LLM-Generated Responses [16.434649348378706]
2つの切り離し戦略を通じて緊張を解消する実践的な枠組みを提案する。
まず、広告挿入と応答生成を分離し、安全性と明示的な開示を確保する。
次に、ジャンル'(ハイレベルなセマンティッククラスタ)をプロキシとして使用することで、特定のユーザクエリから入札を分離する。
論文 参考訳(メタデータ) (2026-01-27T10:16:03Z) - NeuroFilter: Privacy Guardrails for Conversational LLM Agents [50.75206727081996]
本研究は,エージェント型大規模言語モデル(LLM)のプライバシを強制する際の計算上の課題に対処する。
NeuroFilterは、標準違反をモデルのアクティベーション空間における単純な方向にマッピングすることで、コンテキスト整合性を運用するガードレールフレームワークである。
7Bから70Bパラメータのモデルをカバーする15万以上のインタラクションに対する包括的な評価は、NeuroFilterの強力なパフォーマンスを示している。
論文 参考訳(メタデータ) (2026-01-21T05:16:50Z) - Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。
本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文 参考訳(メタデータ) (2025-12-23T03:10:09Z) - DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation in Text-to-Image Models [55.30555646945055]
テキスト・ツー・イメージ(T2I)モデルはセマンティック・リークに対して脆弱である。
DeLeakerは、モデルのアテンションマップに直接介入することで、漏洩を緩和する軽量なアプローチである。
SLIMはセマンティックリークに特化した最初のデータセットである。
論文 参考訳(メタデータ) (2025-10-16T17:39:21Z) - VortexPIA: Indirect Prompt Injection Attack against LLMs for Efficient Extraction of User Privacy [22.037235521470468]
大規模言語モデル(LLM)は、会話型AI(CAI)に広くデプロイされている。
近年の研究では、LLMベースのCAIを操作して、人間から個人情報を抽出し、重大なセキュリティ上の脅威を生じさせることが示されている。
ブラックボックス設定下でのプライバシー抽出を誘導する新しい間接的インジェクション攻撃であるtextscVortexPIAを提案する。
論文 参考訳(メタデータ) (2025-10-05T15:58:55Z) - DP-Fusion: Token-Level Differentially Private Inference for Large Language Models [51.71591819896191]
大規模言語モデル(LLM)は、推論時にプライバシを保存しない。
DP-Fusion は LLM の出力にコンテキスト内のトークンの集合が持つ影響を証明的に束縛する。
提案手法は, 理論的および実証的プライバシを大幅に改善した, 証明可能な民営化文書を作成する。
論文 参考訳(メタデータ) (2025-07-06T20:49:39Z) - Comet: Accelerating Private Inference for Large Language Model by Predicting Activation Sparsity [21.74620410396962]
セキュアなマルチパーティ計算(MPC)は、LLM推論におけるプライバシを保護するための有望なソリューションである。
MPCはサーバ間通信が頻繁に必要であり、高い性能のオーバーヘッドを引き起こす。
本研究では,活性化出力の空間分布を予測するために,高精度かつ高速な予測器を用いた効率的なプライベート推論システムCometを提案する。
Comet は 1.87x-2.63x のスピードアップと 1.94x-2.64x 通信の削減を実現している。
論文 参考訳(メタデータ) (2025-05-12T05:29:30Z) - Differentially Private In-context Learning via Sampling Few-shot Mixed with Zero-shot Outputs [13.790550802100842]
インコンテキスト学習(ICL)は、関連するインプット・アウトプット・サンプル(デモ)でプロンプトを増強することで改善できる。
ICLのデモには、プライバシーに敏感な情報が含まれており、LLM出力によってリークまたは/またはリグルギットすることができる。
ゼロショット出力と混合した複数のワンショット出力の積をサンプリングしてDPテキストを生成するデコードフレームワークである$textttdps-mozo$を提案する。
論文 参考訳(メタデータ) (2025-01-31T16:48:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。