論文の概要: Scalable Private Search with Wally
- arxiv url: http://arxiv.org/abs/2406.06761v5
- Date: Thu, 03 Oct 2024 19:40:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-07 15:05:56.466177
- Title: Scalable Private Search with Wally
- Title(参考訳): Wallyを使ったスケーラブルなプライベート検索
- Authors: Hilal Asi, Fabian Boemer, Nicholas Genise, Muhammad Haris Mughees, Tabitha Ogilvie, Rehan Rishi, Guy N. Rothblum, Kunal Talwar, Karl Tarbe, Ruiyu Zhu, Marco Zuliani,
- Abstract要約: Wallyは、大規模なデータベースに対する効率的なセマンティック検索とキーワード検索クエリをサポートするプライベート検索システムである。
従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。
それぞれのクライアントにいくつかの偽のクエリを追加し、匿名ネットワーク経由でサーバに送信することで、これらの結果が得られます。
- 参考スコア(独自算出の注目度): 27.387418704955994
- License:
- Abstract: This paper presents Wally, a private search system that supports efficient semantic and keyword search queries against large databases. When sufficiently many clients are making queries, Wally's performance is significantly better than previous systems. In previous private search systems, for each client query, the server must perform at least one expensive cryptographic operation per database entry. As a result, performance degraded proportionally with the number of entries in the database. In Wally, we get rid of this limitation. Specifically, for each query the server performs cryptographic operations only against a few database entries. We achieve these results by requiring each client to add a few fake queries and send each query via an anonymous network to the server at independently chosen random instants. Additionally, each client also uses somewhat homomorphic encryption (SHE) to hide whether a query is real or fake. Wally provides $(\epsilon, \delta)$-differential privacy guarantee, which is an accepted standard for strong privacy. The number of fake queries each client makes depends inversely on the number of clients making queries. Therefore, the fake queries' overhead vanishes as the number of clients increases, enabling scalability to millions of queries and large databases. Concretely, Wally can process eight million queries in just 117 mins. That is around four orders of magnitude less than the state of the art.
- Abstract(参考訳): 本稿では,大規模データベースに対する効率的なセマンティック検索およびキーワード検索クエリをサポートする,プライベート検索システムであるWallyを提案する。
十分な数のクライアントがクエリを作成している場合、Wallyのパフォーマンスは以前のシステムよりも大幅に向上する。
従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。
その結果、データベース内のエントリ数に比例して性能が低下した。
Wallyでは、この制限を取り除きます。
具体的には、クエリ毎に、サーバはいくつかのデータベースエントリに対してのみ暗号化操作を実行する。
これらの結果は、クライアントにいくつかの偽のクエリを追加し、匿名ネットワークを介して、独立に選択されたランダムな瞬間に各クエリをサーバに送ることで達成される。
さらに、各クライアントは、クエリが本物か偽かを隠すために、何らかの同型暗号化(SHE)を使用する。
Wallyは$(\epsilon, \delta)$-differential privacy guaranteeを提供する。
各クライアントが行う偽クエリの数は、クエリを作成するクライアントの数に依存する。
そのため、クライアント数が増えるにつれてフェイククエリのオーバーヘッドがなくなり、数百万のクエリや大規模データベースにスケーラビリティが実現される。
具体的には、Wallyはわずか117分で800万のクエリを処理できる。
これは最先端のものよりも4桁ほど少ない。
関連論文リスト
- Are LLM-based methods good enough for detecting unfair terms of service? [67.49487557224415]
大規模言語モデル(LLM)は、長いテキストベースの文書を解析するのに適している。
プライバシーポリシーの集合に対して個別に適用された12の質問からなるデータセットを構築します。
いくつかのオープンソースモデルは、いくつかの商用モデルと比較して高い精度を提供できる。
論文 参考訳(メタデータ) (2024-08-24T09:26:59Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - The Surprising Effectiveness of Rankers Trained on Expanded Queries [4.874071145951159]
我々は,他のクエリのパフォーマンスを損なうことなく,難しいクエリや難しいクエリのランク付け性能を向上させる。
我々は,クエリ毎に推定されるクエリ性能スコアとともに,特殊ランク付け器と基本ランク付け器の関連性スコアを組み合わせる。
DL-Hardデータセットを用いた実験では,クエリ性能に基づくスコアリング手法が,パスランキングタスクにおいて最大25%の大幅な改善を実現していることがわかった。
論文 参考訳(メタデータ) (2024-04-03T09:12:22Z) - Private Aggregate Queries to Untrusted Databases [3.6209090009720155]
プライベート情報検索(Private Information Search, PIR)は、プライバシ保護のための暗号ツールである。
ほとんどのPIRプロトコルは、クライアントが意図したデータベースアイテムの正確な行インデックスを知る必要がある。
我々は、ユーザが集約された結果を取得することができる新しい情報理論PIRフレームワークを構築した。
論文 参考訳(メタデータ) (2024-03-20T04:35:21Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Searching for Better Database Queries in the Outputs of Semantic Parsers [16.221439565760058]
本稿では,テスト時に生成したクエリを評価する外部基準にアクセスできる場合を考える。
クエリがエラーなしに実行されることをチェックすることから、一連のテストでクエリを検証することまで、その基準は様々である。
我々は、最先端のセマンティクスにアプローチを適用し、異なるデータセットですべてのテストを通過する多くのクエリを見つけることができると報告します。
論文 参考訳(メタデータ) (2022-10-13T17:20:45Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Database Reasoning Over Text [11.074939080454412]
我々は、最先端のトランスフォーマーモデルが、小さなデータベースに対して非常によく機能していることを示します。
テキストから複数のスパンにまたがるデータベーススタイルのクエリに応答するモジュールアーキテクチャを提案する。
私たちのアーキテクチャは何千もの事実を含むデータベースにスケールしますが、現代のモデルは、何つの事実をエンコードできるかによって制限されています。
論文 参考訳(メタデータ) (2021-06-02T11:09:40Z) - The Sparse Vector Technique, Revisited [67.57692396665915]
我々は、微分プライバシーの文献において最も基礎的で広く適用可能なテクニックの1つを再考する。
この単純なアルゴリズムは、データベース上のあるクエリの値が、私たちが期待している値に近いかどうかをプライベートにテストします。
一つの個人が過剰なクエリの回答に寄与しない限り、クエリのテストを継続できる代替の、等しくシンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:50:52Z) - Open Domain Question Answering Using Web Tables [8.25461115955717]
ファクトイドクエリと非ファクトイドクエリの両方に対応可能なWebテーブルを用いたオープンドメインQAアプローチを開発した。
当社のソリューションは,主要な商用Web検索エンジンで実運用に使用されており,毎月数千万の実際のユーザクエリに対して直接回答を提供する。
論文 参考訳(メタデータ) (2020-01-10T01:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。