論文の概要: LAPRAS : Learning-Augmented PRivate Answering for linear query Streams
- arxiv url: http://arxiv.org/abs/2605.01960v1
- Date: Sun, 03 May 2026 16:46:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.017457
- Title: LAPRAS : Learning-Augmented PRivate Answering for linear query Streams
- Title(参考訳): LAPRAS : 線形クエリストリームに対する学習強化PRivate Answering
- Authors: Pranay Mundra, Adam Sealfon, Ziteng Sun, Quanquan C. Liu,
- Abstract要約: 本稿では,ストリームに現れる可能性のあるクエリの予測セットを出力するオラクルへのアクセスを想定したLAPRASを提案する。
LAPRASはオフライン最適マトリックスメカニズムを使って予測されたクエリに回答し、残りのクエリを残りの予算からオンラインで回答する。
実証的には、2つの実際のデータセットに対して、意図した一貫性-ロバスト性トレードオフを検証する。
- 参考スコア(独自算出の注目度): 9.706153384025809
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern database workloads are highly predictable: query streams are dominated by recurring jobs and templates, even when their arrival order is not known in advance. This motivates a learning-augmented view of online differentially private (DP) analytics: can algorithms utilize predictions about which queries will occur to improve utility under a single global privacy budget, while remaining robust when predictions are wrong? We study online DP query answering, where a curator must answer a stream $Q$ of $S$ linear queries arriving in uniformly random order under privacy budget $(ε,δ)$. We present LAPRAS, which assumes access to an oracle that outputs a prediction set of queries likely to appear in the stream and uses it to guide privacy spending. LAPRAS answers predicted queries using the offline-optimal Matrix Mechanism and answers the remaining queries online from a residual budget. To pace spending across an unknown number of unpredicted queries, we introduce Smooth Allocation, which forms an unbiased stopping-time estimate $\widehat{B}$ from the first $T=Θ(\log^2 S)$ unpredicted queries and continuously recalibrates per-query expenditure. Empirically, over two real datasets, we validate the intended consistency--robustness trade-off: LAPRAS achieves near-offline utility under high overlap and degrades gracefully to baseline-level performance when overlap is low.
- Abstract(参考訳): クエリストリームは、到着順序が事前に分かっていない場合でも、繰り返しジョブやテンプレートによって支配される。
これは、オンライン微分プライベート(DP)分析の学習強化されたビューを動機付けている。アルゴリズムは、単一のグローバルプライバシ予算の下でユーティリティを改善するために、どのクエリが発生するかを予測することができる。
我々は、オンラインDPクエリ応答を研究し、キュレーターはプライバシー予算$(ε,δ)$のランダムな順番で到着するリニアクエリのストリームに$Q$$$$S$で答えなければならない。
LAPRASは,ストリームに現れる可能性のあるクエリの予測セットを出力し,プライバシ支出のガイドに使用する。
LAPRASはオフライン最適マトリックスメカニズムを使って予測されたクエリに回答し、残りのクエリを残りの予算からオンラインで回答する。
Smooth Allocation(英語版)は、未知数の未予測クエリに対する支出をペーストするため、最初の$T=\(\log^2S)$から非バイアスの停止時間推定を$\widehat{B}$に設定し、クエリ毎の支出を継続的に調整する。
LAPRASは重なり合いの高いニアオフラインユーティリティを実現し、重なり合いが低い場合にはベースラインレベルのパフォーマンスに優しく低下する。
関連論文リスト
- TopBench: A Benchmark for Implicit Prediction and Reasoning over Tabular Question Answering [80.93487993878836]
現実世界のクエリの一般的なクラスは暗黙的に予測され、単に検索するのではなく、歴史的パターンから観測されていない回答を推測する必要がある。
これらのクエリには、潜在意図を認識することと、大規模テーブル上での信頼性の高い予測推論という2つの課題がある。
単点予測から意思決定,処理効果分析,複雑な推論に至るまで,4つのサブタスクにわたる779のサンプルからなるベンチマークであるTopBenchを紹介する。
論文 参考訳(メタデータ) (2026-04-30T16:22:51Z) - Pre-Execution Query Slot-Time Prediction in Cloud Data Warehouses: A Feature-Scoped Machine Learning Approach [0.0]
クラウドデータウェアハウスは、消費されるスロット時間に基づく請求計算を行う。
共有マルチテナント環境では、クエリコストは可変であり、実行前に見積もるのは困難である。
本稿では,事前実行可観測信号のみを用いて,実行前にBigQueryのスロットタイムを予測する機械学習手法を提案する。
論文 参考訳(メタデータ) (2026-04-22T03:15:16Z) - Continuous Semantic Caching for Low-Cost LLM Serving [29.887977985331972]
セマンティックに類似したクエリを持つユーザが再利用できるように、レスポンスのキャッシュは、推論コストとレイテンシを低減する上で重要な戦略となっている。
既存のキャッシュフレームワークでは、離散的なクエリの有限な宇宙を仮定して、キャッシュに対するクエリ応答を決定する方法が提案されている。
我々は,連続的なクエリ空間におけるLLM応答キャッシングを不確実性の下で意味付けるための,最初の厳密な理論的枠組みを確立する。
論文 参考訳(メタデータ) (2026-04-21T21:56:43Z) - Semantic Caching for Low-Cost LLM Serving: From Offline Learning to Online Adaptation [54.61034867177997]
キャッシング推論応答は、大きな言語モデルに他の前方を通さずに、それらを検索することができる。
従来の正確なキャッシュは、クエリ間のセマンティックな類似性を見落とし、不要な再計算をもたらす。
本稿では,未知のクエリおよびコスト分布下でのセマンティックキャッシュ消去のための,原則的,学習ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-11T06:53:27Z) - Conformal Information Pursuit for Interactively Guiding Large Language Models [68.16703423481935]
本稿では,クエリ数の最小化を目的としたシーケンシャルクエリ戦略について検討する。
そのような戦略の1つは情報探索(IP)であり、各反復で情報ゲインを最大化または同等に不確実性を最小化するクエリを選択する。
本稿では,コンフォーマル情報探索法(C-IP)を提案する。
論文 参考訳(メタデータ) (2025-07-04T03:55:39Z) - Private Query Release via the Johnson-Lindenstrauss Transform [93.20051580730234]
差分プライバシーを持つ統計的クエリに対する回答を解放する新しい手法を提案する。
鍵となる考え方は、クエリの回答を低次元空間にランダムに投影することである。
単純なノイズ付加機構を用いて予測されたクエリに回答し、元の次元まで答えを引き上げます。
論文 参考訳(メタデータ) (2022-08-15T19:19:16Z) - Interpretable by Design: Learning Predictors by Composing Interpretable
Queries [8.054701719767293]
機械学習アルゴリズムは設計によって解釈されるべきである。
正確な予測に必要なクエリの数を最小限に抑える。
視覚とNLPタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2022-07-03T02:40:34Z) - A Universal Error Measure for Input Predictions Applied to Online Graph
Problems [57.58926849872494]
本稿では,入力予測における誤差の定量化のための新しい尺度を提案する。
この尺度は、予測されていない要求と予測されていない実際の要求によるエラーをキャプチャする。
論文 参考訳(メタデータ) (2022-05-25T15:24:03Z) - Online Caching with no Regret: Optimistic Learning via Recommendations [15.877673959068458]
ファイル要求の予測を含むFTRL(Follow-the-Regularized-Leader)フレームワークを構築した。
フレームワークを拡張して、多くが利用可能な場合に最適な要求予測器を学習し、利用します。
提案した楽観的な学習キャッシュポリシが,完全予測のためのサブゼロ性能損失(regret)を達成できることを実証する。
論文 参考訳(メタデータ) (2022-04-20T09:29:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。