Fugu-MT 論文翻訳(概要): Scalable Private Search with Wally

論文の概要: Scalable Private Search with Wally

arxiv url: http://arxiv.org/abs/2406.06761v5
Date: Thu, 03 Oct 2024 19:40:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 16:48:38.389912
Title: Scalable Private Search with Wally
Title（参考訳）: Wallyを使ったスケーラブルなプライベート検索
Authors: Hilal Asi, Fabian Boemer, Nicholas Genise, Muhammad Haris Mughees, Tabitha Ogilvie, Rehan Rishi, Guy N. Rothblum, Kunal Talwar, Karl Tarbe, Ruiyu Zhu, Marco Zuliani,
Abstract要約: Wallyは、大規模なデータベースに対する効率的なセマンティック検索とキーワード検索クエリをサポートするプライベート検索システムである。従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。それぞれのクライアントにいくつかの偽のクエリを追加し、匿名ネットワーク経由でサーバに送信することで、これらの結果が得られます。
参考スコア（独自算出の注目度）: 27.387418704955994
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper presents Wally, a private search system that supports efficient semantic and keyword search queries against large databases. When sufficiently many clients are making queries, Wally's performance is significantly better than previous systems. In previous private search systems, for each client query, the server must perform at least one expensive cryptographic operation per database entry. As a result, performance degraded proportionally with the number of entries in the database. In Wally, we get rid of this limitation. Specifically, for each query the server performs cryptographic operations only against a few database entries. We achieve these results by requiring each client to add a few fake queries and send each query via an anonymous network to the server at independently chosen random instants. Additionally, each client also uses somewhat homomorphic encryption (SHE) to hide whether a query is real or fake. Wally provides $(\epsilon, \delta)$-differential privacy guarantee, which is an accepted standard for strong privacy. The number of fake queries each client makes depends inversely on the number of clients making queries. Therefore, the fake queries' overhead vanishes as the number of clients increases, enabling scalability to millions of queries and large databases. Concretely, Wally can process eight million queries in just 117 mins. That is around four orders of magnitude less than the state of the art.
Abstract（参考訳）: 本稿では,大規模データベースに対する効率的なセマンティック検索およびキーワード検索クエリをサポートする,プライベート検索システムであるWallyを提案する。十分な数のクライアントがクエリを作成している場合、Wallyのパフォーマンスは以前のシステムよりも大幅に向上する。従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。その結果、データベース内のエントリ数に比例して性能が低下した。 Wallyでは、この制限を取り除きます。具体的には、クエリ毎に、サーバはいくつかのデータベースエントリに対してのみ暗号化操作を実行する。これらの結果は、クライアントにいくつかの偽のクエリを追加し、匿名ネットワークを介して、独立に選択されたランダムな瞬間に各クエリをサーバに送ることで達成される。さらに、各クライアントは、クエリが本物か偽かを隠すために、何らかの同型暗号化(SHE)を使用する。 Wallyは$(\epsilon, \delta)$-differential privacy guaranteeを提供する。各クライアントが行う偽クエリの数は、クエリを作成するクライアントの数に依存する。そのため、クライアント数が増えるにつれてフェイククエリのオーバーヘッドがなくなり、数百万のクエリや大規模データベースにスケーラビリティが実現される。具体的には、Wallyはわずか117分で800万のクエリを処理できる。これは最先端のものよりも4桁ほど少ない。

関連論文リスト

Private-RAG: Answering Multiple Queries with LLMs while Keeping Your Data Private [21.980739918403344]
Retrieval-augmented Generation (RAG)は、外部コーパスからドキュメントを推論時に取得することで、大きな言語モデル(LLM)を強化する。このコーパスが機密情報を含む場合、保護されていないRAGシステムは個人情報を漏洩するリスクがある。本稿では、より実用的なマルチクエリ設定について検討し、2つのDP-RAGアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-11-10T21:12:32Z)
Private Queries with Sigma-Counting [8.17265021040487]
データプライバシを強化するための一般的なアプローチは、実際のカウントのノイズの多いバージョンを返すことだ。本研究は,これらの課題に対処する新しい手法であるシグマカウンティングの設計と解析を行う。
論文参考訳（メタデータ） (2025-09-07T01:46:24Z)
Privacy-Preserving LLM Interaction with Socratic Chain-of-Thought Reasoning and Homomorphically Encrypted Vector Databases [40.94869284214594]
大規模言語モデル(LLM)は、カレンダー、メール、医療記録などの機密性の高いユーザーデータにアクセスするパーソナルエージェントとして、ますます使われるようになっている。現在、ユーザはトレードオフに直面している。強力なが信頼できないLLMプロバイダにプライベートレコードを送信することで、露出リスクが増大する。
論文参考訳（メタデータ） (2025-06-19T07:13:30Z)
Are LLM-based methods good enough for detecting unfair terms of service? [67.49487557224415]
大規模言語モデル(LLM)は、長いテキストベースの文書を解析するのに適している。プライバシーポリシーの集合に対して個別に適用された12の質問からなるデータセットを構築します。いくつかのオープンソースモデルは、いくつかの商用モデルと比較して高い精度を提供できる。
論文参考訳（メタデータ） (2024-08-24T09:26:59Z)
Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。 DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文参考訳（メタデータ） (2024-06-23T05:02:21Z)
FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference [3.9340847245305732]
我々はFastQueryと呼ばれるプライベートな埋め込みテーブルクエリ最適化フレームワークを提案する。 FastQueryは通信対応の埋め込みテーブル量子化アルゴリズムと1ホット対応の高密度パッキングアルゴリズムを備えている。従来のHEベースのフレームワークと比較して、FastQueryは、それぞれ4.3times$、2.7times$、1.3times$遅延削減を達成した。
論文参考訳（メタデータ） (2024-05-25T13:58:45Z)
The Surprising Effectiveness of Rankers Trained on Expanded Queries [4.874071145951159]
我々は,他のクエリのパフォーマンスを損なうことなく,難しいクエリや難しいクエリのランク付け性能を向上させる。我々は,クエリ毎に推定されるクエリ性能スコアとともに,特殊ランク付け器と基本ランク付け器の関連性スコアを組み合わせる。 DL-Hardデータセットを用いた実験では,クエリ性能に基づくスコアリング手法が,パスランキングタスクにおいて最大25%の大幅な改善を実現していることがわかった。
論文参考訳（メタデータ） (2024-04-03T09:12:22Z)
Private Aggregate Queries to Untrusted Databases [3.6209090009720155]
プライベート情報検索(Private Information Search, PIR)は、プライバシ保護のための暗号ツールである。ほとんどのPIRプロトコルは、クライアントが意図したデータベースアイテムの正確な行インデックスを知る必要がある。我々は、ユーザが集約された結果を取得することができる新しい情報理論PIRフレームワークを構築した。
論文参考訳（メタデータ） (2024-03-20T04:35:21Z)
Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文参考訳（メタデータ） (2023-05-24T06:16:44Z)
Improving Content Retrievability in Search with Controllable Query Generation [5.450798147045502]
マシンが学習した検索エンジンは高い検索可能性バイアスを持ち、クエリの大部分が同じエンティティを返す。そこで我々はCtrlQGenを提案する。CtrlQGenは、選択したインテントナローあるいは広義のクエリを生成する方法である。音楽,ポッドキャスト,書籍の各分野のデータセットから得られた結果から,高密度検索モデルの検索可能性バイアスを著しく低減できることがわかった。
論文参考訳（メタデータ） (2023-03-21T07:46:57Z)
Searching for Better Database Queries in the Outputs of Semantic Parsers [16.221439565760058]
本稿では,テスト時に生成したクエリを評価する外部基準にアクセスできる場合を考える。クエリがエラーなしに実行されることをチェックすることから、一連のテストでクエリを検証することまで、その基準は様々である。我々は、最先端のセマンティクスにアプローチを適用し、異なるデータセットですべてのテストを通過する多くのクエリを見つけることができると報告します。
論文参考訳（メタデータ） (2022-10-13T17:20:45Z)
Private Query Release via the Johnson-Lindenstrauss Transform [93.20051580730234]
差分プライバシーを持つ統計的クエリに対する回答を解放する新しい手法を提案する。鍵となる考え方は、クエリの回答を低次元空間にランダムに投影することである。単純なノイズ付加機構を用いて予測されたクエリに回答し、元の次元まで答えを引き上げます。
論文参考訳（メタデータ） (2022-08-15T19:19:16Z)
Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文参考訳（メタデータ） (2022-04-03T16:50:30Z)
Database Reasoning Over Text [11.074939080454412]
我々は、最先端のトランスフォーマーモデルが、小さなデータベースに対して非常によく機能していることを示します。テキストから複数のスパンにまたがるデータベーススタイルのクエリに応答するモジュールアーキテクチャを提案する。私たちのアーキテクチャは何千もの事実を含むデータベースにスケールしますが、現代のモデルは、何つの事実をエンコードできるかによって制限されています。
論文参考訳（メタデータ） (2021-06-02T11:09:40Z)
The Sparse Vector Technique, Revisited [67.57692396665915]
我々は、微分プライバシーの文献において最も基礎的で広く適用可能なテクニックの1つを再考する。この単純なアルゴリズムは、データベース上のあるクエリの値が、私たちが期待している値に近いかどうかをプライベートにテストします。一つの個人が過剰なクエリの回答に寄与しない限り、クエリのテストを継続できる代替の、等しくシンプルなアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-10-02T10:50:52Z)
Improving Query Safety at Pinterest [46.57632646205479]
PinSetsはクエリセット拡張のためのシステムである。ユーザセッションの検索にはシンプルだが強力なメカニズムが適用される。小さなシードセットを何千もの関連するクエリにほぼ完全な精度で拡張する。
論文参考訳（メタデータ） (2020-06-20T07:35:22Z)
Open Domain Question Answering Using Web Tables [8.25461115955717]
ファクトイドクエリと非ファクトイドクエリの両方に対応可能なWebテーブルを用いたオープンドメインQAアプローチを開発した。当社のソリューションは,主要な商用Web検索エンジンで実運用に使用されており,毎月数千万の実際のユーザクエリに対して直接回答を提供する。
論文参考訳（メタデータ） (2020-01-10T01:25:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。