論文の概要: Private Queries with Sigma-Counting
- arxiv url: http://arxiv.org/abs/2509.07018v1
- Date: Sun, 07 Sep 2025 01:46:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.028071
- Title: Private Queries with Sigma-Counting
- Title(参考訳): Sigma-Countingによるプライベートクエリ
- Authors: Jun Gao, Jie Ding,
- Abstract要約: データプライバシを強化するための一般的なアプローチは、実際のカウントのノイズの多いバージョンを返すことだ。
本研究は,これらの課題に対処する新しい手法であるシグマカウンティングの設計と解析を行う。
- 参考スコア(独自算出の注目度): 8.17265021040487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many data applications involve counting queries, where a client specifies a feasible range of variables and a database returns the corresponding item counts. A program that produces the counts of different queries often risks leaking sensitive individual-level information. A popular approach to enhance data privacy is to return a noisy version of the actual count. It is typically achieved by adding independent noise to each query and then control the total privacy budget within a period. This approach may be limited in the number of queries and output accuracy in practice. Also, the returned counts do not maintain the total order for nested queries, an important feature in many applications. This work presents the design and analysis of a new method, sigma-counting, that addresses these challenges. Sigma-counting uses the notion of sigma-algebra to construct privacy-preserving counting queries. We show that the proposed concepts and methods can significantly improve output accuracy while maintaining a desired privacy level in the presence of massive queries to the same data. We also discuss how the technique can be applied to address large and time-varying datasets.
- Abstract(参考訳): クライアントが実行可能な変数範囲を指定し、データベースが対応するアイテムカウントを返す。
異なるクエリの数を生成できるプログラムは、敏感な個人レベルの情報をリークするリスクをしばしば負う。
データプライバシを強化するための一般的なアプローチは、実際のカウントのノイズの多いバージョンを返すことだ。
一般的には、各クエリに独立したノイズを加えて、1時間以内に全体のプライバシ予算を制御することで達成される。
このアプローチは、実際にクエリの数と出力精度に制限される可能性がある。
また、返されるカウントは、多くのアプリケーションで重要な機能であるネストクエリの総順序を維持できない。
本研究は,これらの課題に対処する新しい手法であるシグマカウンティングの設計と解析を行う。
Sigma-countingは、sigma-algebraという概念を使って、プライバシ保護のカウントクエリを構築する。
提案手法は,同一データに対する大量のクエリが存在する場合に,所望のプライバシレベルを維持しつつ,出力精度を大幅に向上させることができることを示す。
また、この手法が大規模かつ時間的に変化するデータセットにどのように適用できるかについても論じる。
関連論文リスト
- Improving Statistical Privacy by Subsampling [0.0]
プライバシメカニズムとしてよく使われるのは、クエリに応答するデータのサンプルを取得することだ。
本論文は, 統計的条件下で, サンプリング方法の違いが, プライバシを増加させるかどうかを, 正確に検証する。
DP設定のトレードオフ関数は (epsilon,delta)-pairs よりもプライバシーの指標として提案されている。
論文 参考訳(メタデータ) (2025-04-15T17:40:45Z) - Statistical Privacy [0.0]
本稿では,データベース生成時の分布を敵が把握している状況について考察する。
分布のエントロピーが、プロパティクエリと呼ばれる大規模なクエリのプライバシを如何に保証しているかを詳細に分析する。
論文 参考訳(メタデータ) (2025-01-22T14:13:44Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Private Approximate Query over Horizontal Data Federation [0.0]
既存のアプローチは、プライバシを改善する暗号に頼っているが、クエリ応答時間を犠牲にしている。
本稿では,データ分散を意識したオンラインサンプリング手法を考案し,レンジクエリの実行を高速化する手法を提案する。
我々のソリューションは、基本的な非セキュアなソリューションよりも最大8倍高速な処理を提供できる。
論文 参考訳(メタデータ) (2024-06-17T11:19:58Z) - Active Sampling of Multiple Sources for Sequential Estimation [92.37271004438406]
本研究の目的は,パラメータを逐次推定するアクティブサンプリングアルゴリズムを設計し,信頼性の高い推定値を生成することである。
本稿では, エンフ条件推定コスト関数を導入し, 最近, トラクタブル解析を施した逐次推定手法を提案する。
論文 参考訳(メタデータ) (2022-08-10T15:58:05Z) - Approximate Query Processing for Group-By Queries based on Conditional
Generative Models [3.9837198605506963]
グループバイクエリには複数の値が含まれるため、すべてのグループに対して十分な正確な推定を行うのは難しい。
階層化サンプリングは、一様サンプリングに比べて精度が向上するが、特定のクエリで選択されたサンプルは他のクエリでは動作しない。
オンラインサンプリングは、クエリ時に与えられたクエリのサンプルを選択するが、長いレイテンシを必要とする。
提案フレームワークは階層化サンプリングとオンラインアグリゲーションを組み合わせることで,グループバイクエリの推定精度を向上させることができる。
論文 参考訳(メタデータ) (2021-01-08T08:49:21Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z) - The Sparse Vector Technique, Revisited [67.57692396665915]
我々は、微分プライバシーの文献において最も基礎的で広く適用可能なテクニックの1つを再考する。
この単純なアルゴリズムは、データベース上のあるクエリの値が、私たちが期待している値に近いかどうかをプライベートにテストします。
一つの個人が過剰なクエリの回答に寄与しない限り、クエリのテストを継続できる代替の、等しくシンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:50:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。