論文の概要: Hiding in Plain Sight: Query Obfuscation via Random Multilingual Searches
- arxiv url: http://arxiv.org/abs/2506.04963v1
- Date: Thu, 05 Jun 2025 12:38:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.700765
- Title: Hiding in Plain Sight: Query Obfuscation via Random Multilingual Searches
- Title(参考訳): 平易な視点で考える:ランダム多言語検索によるクエリ難読化
- Authors: Anton Firc, Jan Klusáček, Kamil Malinka,
- Abstract要約: パーソナライゼーションは関連性を高め プライバシーのリスクをもたらし バブルをフィルタします
本稿では,ランダムに生成された多言語検索クエリを用いた軽量なクライアント側クエリ難読化戦略を提案し,評価する。
その結果,検索結果の表示は比較的安定しているものの,ユーザの関心は難易度に大きく変化していることがわかった。
- 参考スコア(独自算出の注目度): 1.3654846342364308
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern search engines extensively personalize results by building detailed user profiles based on query history and behaviour. While personalization can enhance relevance, it introduces privacy risks and can lead to filter bubbles. This paper proposes and evaluates a lightweight, client-side query obfuscation strategy using randomly generated multilingual search queries to disrupt user profiling. Through controlled experiments on the Seznam.cz search engine, we assess the impact of interleaving real queries with obfuscating noise in various language configurations and ratios. Our findings show that while displayed search results remain largely stable, the search engine's identified user interests shift significantly under obfuscation. We further demonstrate that such random queries can prevent accurate profiling and overwrite established user profiles. This study provides practical evidence for query obfuscation as a viable privacy-preserving mechanism and introduces a tool that enables users to autonomously protect their search behaviour without modifying existing infrastructure.
- Abstract(参考訳): 現代の検索エンジンは、クエリ履歴と振る舞いに基づいて詳細なユーザプロファイルを構築することで、結果を広範囲にパーソナライズする。
パーソナライゼーションは関連性を高めることができるが、プライバシのリスクを導入し、バブルをフィルタする可能性がある。
本稿では、ランダムに生成された多言語検索クエリを用いて、ユーザプロファイリングを妨害する軽量なクライアント側クエリ難読化戦略を提案し、評価する。
Seznam.czサーチエンジンの制御実験により,様々な言語構成と比率において,難聴雑音を伴う実問合せが与える影響を評価する。
その結果,検索結果の表示は比較的安定しているものの,ユーザの関心は難易度に大きく変化していることがわかった。
さらに、そのようなランダムなクエリは、正確なプロファイリングや、確立されたユーザプロファイルの上書きを防止できることを示す。
本研究は,プライバシ保護機構としてのクエリ難読化の実践的証拠を提供するとともに,既存のインフラストラクチャを変更することなく,ユーザが自律的に検索行動を保護するツールを提案する。
関連論文リスト
- Query Smarter, Trust Better? Exploring Search Behaviours for Verifying News Accuracy [35.07647423247397]
本研究では,異なるクエリ生成戦略がニュース検証に与える影響と,検索方法が情報評価の精度に与える影響について検討する。
その結果,検索行動はニュースに対する信頼に大きく影響し,複数のクエリを含む検索が高品質な結果をもたらすことがわかった。
ブースト」の介入は限られた影響しか与えなかったが、ユーザによる検索結果の徹底的なレビューを促すインタフェース設計により、クエリの定式化が促進されることが示唆された。
論文 参考訳(メタデータ) (2025-04-07T14:50:13Z) - Pointwise Mutual Information as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
文脈と問合せの間のポイントワイドな相互情報は,言語モデルの性能向上に有効な指標であることを示す。
本稿では,文書と質問のポイントワイドな相互情報を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - The language of sound search: Examining User Queries in Audio Search Engines [0.2455468619225742]
テキストベースの音声検索システムの設計における現実世界のユーザニーズと振る舞いについて、研究は不十分に対処する。
このギャップを埋めるために、カスタムサーベイとFreesound Webサイトクエリログという、2つのソースからの検索クエリを分析しました。
その結果,調査クエリは一般にFreesoundクエリよりも長いことが示唆され,システム制約によって制限されない場合,ユーザが詳細なクエリを好むことが示唆された。
論文 参考訳(メタデータ) (2024-10-10T19:24:13Z) - Improving Retrieval in Sponsored Search by Leveraging Query Context Signals [6.152499434499752]
本稿では,クエリをリッチなコンテキスト信号で拡張することで,クエリ理解を強化する手法を提案する。
我々は、Web検索のタイトルとスニペットを使って、現実世界の情報にクエリを接地し、GPT-4を使ってクエリの書き直しと説明を生成する。
我々の文脈認識アプローチは文脈自由モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2024-07-19T14:28:53Z) - AutoBencher: Towards Declarative Benchmark Construction [74.54640925146289]
AutoBencherを使って、数学、多言語性、知識、安全性のためのデータセットを作成しています。
AutoBencherのスケーラビリティにより、詳細なカテゴリ知識をテストでき、既存のベンチマークよりも22%のモデルエラー(難易度)を誘発するデータセットを作成することができる。
論文 参考訳(メタデータ) (2024-07-11T10:03:47Z) - Words Blending Boxes. Obfuscating Queries in Information Retrieval using Differential Privacy [7.831978389504435]
情報検索システム(IRS)がユーザのプライバシを保護していない場合、システムに送信されたクエリを通じて機密情報を開示することができる。
最近の改良、特にNLPは、テキストを難読化するために差分プライバシーを使用する可能性を示している。
本稿では,クエリ難読化のための新しいプライベートなメカニズムであるWord Blending Boxesを提案する。
論文 参考訳(メタデータ) (2024-05-15T12:51:36Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - Semantics-Preserved Distortion for Personal Privacy Protection in Information Management [65.08939490413037]
本稿では,意味的整合性を維持しつつテキストを歪ませる言語学的アプローチを提案する。
本稿では, 意味保存歪みの枠組みとして, 生成的アプローチと置換的アプローチの2つを提示する。
また、特定の医療情報管理シナリオにおけるプライバシ保護についても検討し、機密データの記憶を効果的に制限していることを示す。
論文 参考訳(メタデータ) (2022-01-04T04:01:05Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Improving Query Safety at Pinterest [46.57632646205479]
PinSetsはクエリセット拡張のためのシステムである。
ユーザセッションの検索にはシンプルだが強力なメカニズムが適用される。
小さなシードセットを何千もの関連するクエリにほぼ完全な精度で拡張する。
論文 参考訳(メタデータ) (2020-06-20T07:35:22Z) - Query Intent Detection from the SEO Perspective [0.34376560669160383]
ユーザクエリの意図を,Googleの結果と機械学習の手法を利用して識別することを目的としている。
クラスタ化されたクエリから抽出されたキーワードのリストは、与えられた新しいクエリの意図を特定するために使用される。
論文 参考訳(メタデータ) (2020-06-16T13:08:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。