論文の概要: DPSQL+: A Differentially Private SQL Library with a Minimum Frequency Rule
- arxiv url: http://arxiv.org/abs/2602.22699v1
- Date: Thu, 26 Feb 2026 07:21:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.573903
- Title: DPSQL+: A Differentially Private SQL Library with a Minimum Frequency Rule
- Title(参考訳): DPSQL+:最小周波数ルールを持つ、微分プライベートなSQLライブラリ
- Authors: Tomoya Matsumoto, Shokichi Takakura, Shun Takagi, Satoshi Hasegawa,
- Abstract要約: 差別化プライバシ(DP)は厳格なプライバシー保証を提供するが、実際には、Emphminimumpreserving Ruleのようなガバナンス要件を満たしていない。
我々は、ユーザレベルの$(varepsilon,)$-DPと最小周波数ルールDP+を同時に適用する、プライバシ-AccountsqlライブラリであるtextbfDP+を提示する。
- 参考スコア(独自算出の注目度): 4.794822439017277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: SQL is the de facto interface for exploratory data analysis; however, releasing exact query results can expose sensitive information through membership or attribute inference attacks. Differential privacy (DP) provides rigorous privacy guarantees, but in practice, DP alone may not satisfy governance requirements such as the \emph{minimum frequency rule}, which requires each released group (cell) to include contributions from at least $k$ distinct individuals. In this paper, we present \textbf{DPSQL+}, a privacy-preserving SQL library that simultaneously enforces user-level $(\varepsilon,δ)$-DP and the minimum frequency rule. DPSQL+ adopts a modular architecture consisting of: (i) a \emph{Validator} that statically restricts queries to a DP-safe subset of SQL; (ii) an \emph{Accountant} that consistently tracks cumulative privacy loss across multiple queries; and (iii) a \emph{Backend} that interfaces with various database engines, ensuring portability and extensibility. Experiments on the TPC-H benchmark demonstrate that DPSQL+ achieves practical accuracy across a wide range of analytical workloads -- from basic aggregates to quadratic statistics and join operations -- and allows substantially more queries under a fixed global privacy budget than prior libraries in our evaluation.
- Abstract(参考訳): SQLは探索的なデータ分析のためのデファクトインターフェースであるが、正確なクエリ結果を公開することで、メンバシップや属性推論攻撃を通じて機密情報を公開することができる。
差分プライバシー(DP)は厳格なプライバシー保証を提供するが、実際にはDPだけでは、少なくとも$k$の個人からの貢献を各リリースグループ(セル)に要求する「emph{minimum frequency rule}」のようなガバナンス要件を満たすことができない。
本稿では,ユーザレベルの$(\varepsilon,δ)$-DPと最小周波数ルールを同時に適用したプライバシ保護SQLライブラリである‘textbf{DPSQL+}を提示する。
DPSQL+はモジュールアーキテクチャを採用しています。
i) SQLのDPセーフなサブセットにクエリを静的に制限する \emph{Validator}
(ii)複数のクエリにわたる累積的なプライバシ損失を一貫して追跡するemph{Accountant}
(iii)様々なデータベースエンジンとインターフェースし、ポータビリティと拡張性を保証する \emph{Backend}。
TPC-Hベンチマークの実験では、DPSQL+は、基本的な集計から2次統計まで、幅広い分析ワークロードで実用的な精度を実現しており、我々の評価では、固定されたグローバルプライバシ予算の下でのクエリが、以前のライブラリよりもはるかに多いことが示されている。
関連論文リスト
- Boundary-Aware NL2SQL: Integrating Reliability through Hybrid Reward and Data Synthesis [23.501567675008264]
BAR- Mutation(Boundary-Aware Reliable NL2)は,信頼性と境界認識を直接生成プロセスに組み込む統合トレーニングフレームワークである。
我々は、解釈可能性を確保するために知識集合推論合成を用いる。
論文 参考訳(メタデータ) (2026-01-15T11:55:01Z) - Private-RAG: Answering Multiple Queries with LLMs while Keeping Your Data Private [21.980739918403344]
Retrieval-augmented Generation (RAG)は、外部コーパスからドキュメントを推論時に取得することで、大きな言語モデル(LLM)を強化する。
このコーパスが機密情報を含む場合、保護されていないRAGシステムは個人情報を漏洩するリスクがある。
本稿では、より実用的なマルチクエリ設定について検討し、2つのDP-RAGアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-11-10T21:12:32Z) - SQLBarber: A System Leveraging Large Language Models to Generate Customized and Realistic SQL Workloads [18.665946271507117]
sqlBarberはLarge Language Models(LLM)に基づくシステムで、カスタマイズされたリアルなsqlワークロードを生成する。
クエリ生成時間を1~3桁に短縮し、ターゲットのコスト分布との整合性を大幅に改善する。
我々は、SnowflakeとAmazon Redshiftの実際の統計に基づいて、さまざまな難易度とクエリコスト分布の10のベンチマークを構築し、オープンソース化する。
論文 参考訳(メタデータ) (2025-07-08T17:20:34Z) - DP-2Stage: Adapting Language Models as Differentially Private Tabular Data Generators [47.86275136491794]
差分プライベートデータ生成のための2段階微調整フレームワークDP-2Stageを提案する。
実験結果から、このアプローチは様々な設定やメトリクスのパフォーマンスを改善することが示された。
論文 参考訳(メタデータ) (2024-12-03T14:10:09Z) - Metric Differential Privacy at the User-Level Via the Earth Mover's Distance [34.63551774740707]
メートル差プライバシー(DP)は、入力のペア間の距離に基づいて不均一なプライバシー保証を提供する。
本稿では,ユーザレベルでのメートル法DPの自然な定義について検討する。
線形クエリとアイテムワイズクエリに応答する2つの新しいメカニズムを$d_textsfEM$-DPで設計する。
論文 参考訳(メタデータ) (2024-05-04T13:29:11Z) - How Private are DP-SGD Implementations? [61.19794019914523]
2種類のバッチサンプリングを使用する場合、プライバシ分析の間に大きなギャップがあることが示される。
その結果,2種類のバッチサンプリングでは,プライバシ分析の間に大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2024-03-26T13:02:43Z) - Qrlew: Rewriting SQL into Differentially Private SQL [2.5475486924467075]
Qrlewはオープンソースのライブラリで、Relationsにクエリを解析できる。
リッチなデータ型、値範囲、および行のオーナシップを追跡します。
論文 参考訳(メタデータ) (2024-01-11T22:01:35Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - "What Do You Mean by That?" A Parser-Independent Interactive Approach
for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。
PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-11-09T02:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。