論文の概要: Exposing Query Identification for Search Transparency
- arxiv url: http://arxiv.org/abs/2110.07701v1
- Date: Thu, 14 Oct 2021 20:19:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 13:20:36.692432
- Title: Exposing Query Identification for Search Transparency
- Title(参考訳): 検索透明性のためのクエリの抽出
- Authors: Ruohan Li, Jianxiang Li, Bhaskar Mitra, Fernando Diaz, Asia J. Biega
- Abstract要約: 本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
- 参考スコア(独自算出の注目度): 69.06545074617685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Search systems control the exposure of ranked content to searchers. In many
cases, creators value not only the exposure of their content but, moreover, an
understanding of the specific searches where the content is surfaced. The
problem of identifying which queries expose a given piece of content in the
ranking results is an important and relatively under-explored search
transparency challenge. Exposing queries are useful for quantifying various
issues of search bias, privacy, data protection, security, and search engine
optimization.
Exact identification of exposing queries in a given system is computationally
expensive, especially in dynamic contexts such as web search. In quest of a
more lightweight solution, we explore the feasibility of approximate exposing
query identification (EQI) as a retrieval task by reversing the role of queries
and documents in two classes of search systems: dense dual-encoder models and
traditional BM25 models. We then propose how this approach can be improved
through metric learning over the retrieval embedding space. We further derive
an evaluation metric to measure the quality of a ranking of exposing queries,
as well as conducting an empirical analysis focusing on various practical
aspects of approximate EQI.
- Abstract(参考訳): 検索システムは、ランク付けされたコンテンツの検索者への露出を制御する。
多くの場合、クリエーターはコンテンツの露出だけでなく、コンテンツが表面化されている特定の検索の理解も重視している。
どのクェリがランク付け結果に特定のコンテントを露出させるかを特定する問題は、重要で比較的未検討の検索透明性の課題である。
クエリの公開は,検索バイアス,プライバシ,データ保護,セキュリティ,検索エンジン最適化といったさまざまな問題の定量化に有用だ。
特定のシステムにおけるクエリの正確な識別は、特にWeb検索のような動的コンテキストにおいて、計算コストが高い。
より軽量な解を求めるため,2種類の検索システムにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとして近似型クエリ識別(EQI)の実現可能性を検討する。
次に,検索埋め込み空間上でのメトリック学習によって,このアプローチがいかに改善されるかを提案する。
さらに、クエリのランク付けの質を測定するための評価基準を導出するとともに、近似EQIの様々な実践的側面に着目した実証分析を行う。
関連論文リスト
- Asking Multimodal Clarifying Questions in Mixed-Initiative
Conversational Search [89.1772985740272]
混合開始型会話検索システムでは、質問を明確にすることで、意図を単一のクエリで表現するのに苦労するユーザを支援する。
マルチモーダル情報が関係するシナリオでは、非テクスチャ情報を用いることで、明確化のプロセスを改善することができると仮定する。
質問を明確にする4k以上のマルチモーダルを含むMelonというデータセットを収集し、14k以上の画像で濃縮する。
クエリの明確化フェーズにおけるマルチモーダルコンテンツの重要性を理解するために,いくつかの解析を行った。
論文 参考訳(メタデータ) (2024-02-12T16:04:01Z) - Event-driven Real-time Retrieval in Web Search [15.235255100530496]
本稿では,リアルタイム検索の意図を表すイベント情報を用いてクエリを拡張する。
マルチタスクトレーニングにより、イベント表現のためのモデルの能力をさらに強化する。
提案手法は既存の最先端のベースライン法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-12-01T06:30:31Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - Improving Content Retrievability in Search with Controllable Query
Generation [5.450798147045502]
マシンが学習した検索エンジンは高い検索可能性バイアスを持ち、クエリの大部分が同じエンティティを返す。
そこで我々はCtrlQGenを提案する。CtrlQGenは、選択したインテントナローあるいは広義のクエリを生成する方法である。
音楽,ポッドキャスト,書籍の各分野のデータセットから得られた結果から,高密度検索モデルの検索可能性バイアスを著しく低減できることがわかった。
論文 参考訳(メタデータ) (2023-03-21T07:46:57Z) - Compositional Attention: Disentangling Search and Retrieval [66.7108739597771]
Multi-head, key-value attention は Transformer モデルとそのバリエーションのバックボーンである。
標準的なアテンションヘッドは、検索と検索の間の厳密なマッピングを学ぶ。
本稿では,標準ヘッド構造を置き換える新しいアテンション機構であるコンポジションアテンションアテンションを提案する。
論文 参考訳(メタデータ) (2021-10-18T15:47:38Z) - Improving Query Representations for Dense Retrieval with Pseudo
Relevance Feedback [29.719150565643965]
本稿では,疑似関連性フィードバック(PRF)を用いて高密度検索のためのクエリ表現を改善する新しいクエリエンコーダであるANCE-PRFを提案する。
ANCE-PRF は BERT エンコーダを使用し、検索モデルである ANCE からクエリとトップ検索されたドキュメントを消費し、関連ラベルから直接クエリの埋め込みを生成する。
PRFエンコーダは、学習された注意機構でノイズを無視しながら、PRF文書から関連および補完的な情報を効果的にキャプチャする。
論文 参考訳(メタデータ) (2021-08-30T18:10:26Z) - Neural Methods for Effective, Efficient, and Exposure-Aware Information
Retrieval [7.3371176873092585]
情報検索の具体的なニーズと課題に動機づけられた新しいニューラルアーキテクチャと手法を紹介します。
多くの実生活のIRタスクにおいて、検索には数十億のドキュメントを含む商用Web検索エンジンのドキュメントインデックスなど、非常に大規模なコレクションが含まれる。
論文 参考訳(メタデータ) (2020-12-21T21:20:16Z) - Guided Transformer: Leveraging Multiple External Sources for
Representation Learning in Conversational Search [36.64582291809485]
あいまいなクエリやフェースドクエリに対する質問を明確にすることは,様々な情報検索システムにおいて有用な手法として認識されている。
本稿では,トランスフォーマーネットワークが学習した表現を,外部情報ソースからの新たなアテンション機構を用いて強化する。
実験では,検索の明確化のための公開データセットを用いて,競合するベースラインと比較して大きな改善点を示した。
論文 参考訳(メタデータ) (2020-06-13T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。