論文の概要: Scalable Private Search with Wally
- arxiv url: http://arxiv.org/abs/2406.06761v6
- Date: Thu, 03 Apr 2025 22:58:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 18:16:37.613061
- Title: Scalable Private Search with Wally
- Title(参考訳): Wallyを使ったスケーラブルなプライベート検索
- Authors: Hilal Asi, Fabian Boemer, Nicholas Genise, Muhammad Haris Mughees, Tabitha Ogilvie, Rehan Rishi, Kunal Talwar, Karl Tarbe, Akshay Wadia, Ruiyu Zhu, Marco Zuliani,
- Abstract要約: Wallyは、大規模なデータベースに対する効率的な検索クエリをサポートするプライベート検索システムである。
3.2百万のエントリを持つデータベースでは、Wallyのクエリ/秒(QPS)は7-28倍高く、通信はTiptoeより6.69-31倍小さい。
- 参考スコア(独自算出の注目度): 23.88335656904761
- License:
- Abstract: This paper presents Wally, a private search system that supports efficient search queries against large databases. When sufficiently many clients are making queries, Wally's performance is significantly better than previous systems while providing a standard privacy guarantee of $(\epsilon, \delta)$-differential privacy. Specifically, for a database with 3.2 million entries, Wally's queries per second (QPS) is 7-28x higher, and communication is 6.69-31x smaller than Tiptoe, a state-of-the-art private search system. In Wally, each client adds a few fake queries and sends each query via an anonymous network to the server at independently chosen random instants. We also use somewhat homomorphic encryption (SHE) to reduce the communication size. The number of fake queries each client makes depends inversely on the number of clients making queries. Therefore, the overhead of fake queries vanishes as the number of honest clients increases, enabling scalability to millions of queries and large databases.
- Abstract(参考訳): 本稿では,大規模データベースに対する効率的な検索クエリをサポートするプライベート検索システムであるWallyについて述べる。
十分な数のクライアントがクエリを作成している場合、Wallyのパフォーマンスは以前のシステムよりも大幅に向上すると同時に、標準的なプライバシ保証として$(\epsilon, \delta)$-differential Privacyを提供する。
具体的には、3200万のエントリを持つデータベースでは、Wallyのクエリ/秒(QPS)は7-28倍高く、通信は最先端のプライベートサーチシステムであるTiptoeよりも6.69-31倍小さい。
Wallyでは、各クライアントがいくつかの偽のクエリを追加し、匿名ネットワークを介して、独立に選択されたランダムな瞬間に各クエリをサーバに送る。
また、通信サイズを減らすために、何らかの準同型暗号化(SHE)も使用しています。
各クライアントが行う偽クエリの数は、クエリを作成するクライアントの数に依存する。
したがって、フェイククエリのオーバーヘッドは、正直なクライアントの数が増えるにつれて消え、数百万のクエリや大規模なデータベースにスケーラビリティが実現される。
関連論文リスト
- Are LLM-based methods good enough for detecting unfair terms of service? [67.49487557224415]
大規模言語モデル(LLM)は、長いテキストベースの文書を解析するのに適している。
プライバシーポリシーの集合に対して個別に適用された12の質問からなるデータセットを構築します。
いくつかのオープンソースモデルは、いくつかの商用モデルと比較して高い精度を提供できる。
論文 参考訳(メタデータ) (2024-08-24T09:26:59Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - The Surprising Effectiveness of Rankers Trained on Expanded Queries [4.874071145951159]
我々は,他のクエリのパフォーマンスを損なうことなく,難しいクエリや難しいクエリのランク付け性能を向上させる。
我々は,クエリ毎に推定されるクエリ性能スコアとともに,特殊ランク付け器と基本ランク付け器の関連性スコアを組み合わせる。
DL-Hardデータセットを用いた実験では,クエリ性能に基づくスコアリング手法が,パスランキングタスクにおいて最大25%の大幅な改善を実現していることがわかった。
論文 参考訳(メタデータ) (2024-04-03T09:12:22Z) - Private Aggregate Queries to Untrusted Databases [3.6209090009720155]
プライベート情報検索(Private Information Search, PIR)は、プライバシ保護のための暗号ツールである。
ほとんどのPIRプロトコルは、クライアントが意図したデータベースアイテムの正確な行インデックスを知る必要がある。
我々は、ユーザが集約された結果を取得することができる新しい情報理論PIRフレームワークを構築した。
論文 参考訳(メタデータ) (2024-03-20T04:35:21Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Searching for Better Database Queries in the Outputs of Semantic Parsers [16.221439565760058]
本稿では,テスト時に生成したクエリを評価する外部基準にアクセスできる場合を考える。
クエリがエラーなしに実行されることをチェックすることから、一連のテストでクエリを検証することまで、その基準は様々である。
我々は、最先端のセマンティクスにアプローチを適用し、異なるデータセットですべてのテストを通過する多くのクエリを見つけることができると報告します。
論文 参考訳(メタデータ) (2022-10-13T17:20:45Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Database Reasoning Over Text [11.074939080454412]
我々は、最先端のトランスフォーマーモデルが、小さなデータベースに対して非常によく機能していることを示します。
テキストから複数のスパンにまたがるデータベーススタイルのクエリに応答するモジュールアーキテクチャを提案する。
私たちのアーキテクチャは何千もの事実を含むデータベースにスケールしますが、現代のモデルは、何つの事実をエンコードできるかによって制限されています。
論文 参考訳(メタデータ) (2021-06-02T11:09:40Z) - The Sparse Vector Technique, Revisited [67.57692396665915]
我々は、微分プライバシーの文献において最も基礎的で広く適用可能なテクニックの1つを再考する。
この単純なアルゴリズムは、データベース上のあるクエリの値が、私たちが期待している値に近いかどうかをプライベートにテストします。
一つの個人が過剰なクエリの回答に寄与しない限り、クエリのテストを継続できる代替の、等しくシンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:50:52Z) - Open Domain Question Answering Using Web Tables [8.25461115955717]
ファクトイドクエリと非ファクトイドクエリの両方に対応可能なWebテーブルを用いたオープンドメインQAアプローチを開発した。
当社のソリューションは,主要な商用Web検索エンジンで実運用に使用されており,毎月数千万の実際のユーザクエリに対して直接回答を提供する。
論文 参考訳(メタデータ) (2020-01-10T01:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。