論文の概要: Event-Centric Query Expansion in Web Search
- arxiv url: http://arxiv.org/abs/2305.19019v1
- Date: Tue, 30 May 2023 13:19:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 16:13:58.259079
- Title: Event-Centric Query Expansion in Web Search
- Title(参考訳): Web検索におけるイベント中心クエリの拡張
- Authors: Yanan Zhang, Weijie Cui, Yangfan Zhang, Xiaoling Bai, Zhe Zhang, Jin
Ma, Xiang Chen, Tianhua Zhou
- Abstract要約: イベント中心クエリ拡張(英: Event-Centric Query Expansion, EQE)は、大量の潜在的なイベントを迅速かつ正確に抽出する新しいQEシステムである。
このシステムはTencent QQ Browser Searchにデプロイされ、数億人のユーザーに提供された。
- 参考スコア(独自算出の注目度): 12.341071896152174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In search engines, query expansion (QE) is a crucial technique to improve
search experience. Previous studies often rely on long-term search log mining,
which leads to slow updates and is sub-optimal for time-sensitive news
searches. In this work, we present Event-Centric Query Expansion (EQE), a novel
QE system that addresses these issues by mining the best expansion from a
significant amount of potential events rapidly and accurately. This system
consists of four stages, i.e., event collection, event reformulation, semantic
retrieval and online ranking. Specifically, we first collect and filter news
headlines from websites. Then we propose a generation model that incorporates
contrastive learning and prompt-tuning techniques to reformulate these
headlines to concise candidates. Additionally, we fine-tune a dual-tower
semantic model to function as an encoder for event retrieval and explore a
two-stage contrastive training approach to enhance the accuracy of event
retrieval. Finally, we rank the retrieved events and select the optimal one as
QE, which is then used to improve the retrieval of event-related documents.
Through offline analysis and online A/B testing, we observe that the EQE system
significantly improves many metrics compared to the baseline. The system has
been deployed in Tencent QQ Browser Search and served hundreds of millions of
users. The dataset and baseline codes are available at
https://open-event-hub.github.io/eqe .
- Abstract(参考訳): 検索エンジンでは,クエリ拡張(QE)が検索エクスペリエンスを向上させる重要な手法である。
従来の研究はしばしば長期の検索ログマイニングに依存しており、更新が遅くなり、時間に敏感なニュース検索に最適である。
本稿では,イベント中心のクエリ拡張(eqe)について述べる。このqeシステムでは,大量の潜在的なイベントから最適な拡張を迅速かつ正確に抽出することにより,これらの問題に対処する。
このシステムは、イベント収集、イベントリフォーム、意味検索、オンラインランキングの4段階からなる。
具体的には、まずニュースの見出しをWebサイトから集めてフィルターする。
そこで我々は,これらの見出しを簡潔な候補に再構成するために,コントラスト学習と即時学習を取り入れた生成モデルを提案する。
さらに,イベント検索のためのエンコーダとして機能するデュアルタワーセマンティクスモデルを微調整し,イベント検索の精度を向上させるための2段階コントラストトレーニング手法を検討する。
最後に、検索したイベントをランク付けし、最適なイベントをQEとして選択し、イベント関連文書の検索を改善する。
オフライン分析とオンラインA/Bテストにより、EQEシステムはベースラインと比較して多くの指標を著しく改善する。
このシステムはTencent QQ Browser Searchにデプロイされ、数億人のユーザーに提供された。
データセットとベースラインコードはhttps://open-event-hub.github.io/eqeで入手できる。
関連論文リスト
- Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - Event-enhanced Retrieval in Real-time Search [5.720930457681116]
既存の埋め込みベースの検索モデルは、しばしば「セマンティックドリフト」問題に直面し、キー情報に重点を置いていない。
本稿では,デュアルエンコーダモデルの改良により,リアルタイム検索性能を向上させるEERという新しい手法を提案する。
我々は,この手法が情報検索の分野で新たな視点をもたらすと信じている。
論文 参考訳(メタデータ) (2024-04-09T03:47:48Z) - Event-driven Real-time Retrieval in Web Search [15.235255100530496]
本稿では,リアルタイム検索の意図を表すイベント情報を用いてクエリを拡張する。
マルチタスクトレーニングにより、イベント表現のためのモデルの能力をさらに強化する。
提案手法は既存の最先端のベースライン法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-12-01T06:30:31Z) - Improving Text Matching in E-Commerce Search with A Rationalizable,
Intervenable and Fast Entity-Based Relevance Model [78.80174696043021]
エンティティベース関連モデル(EBRM)と呼ばれる新しいモデルを提案する。
この分解により、高精度にクロスエンコーダQE関連モジュールを使用できる。
また、ユーザログから自動生成されたQEデータによるQEモジュールの事前トレーニングにより、全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-07-01T15:44:53Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Event-Driven Query Expansion [23.08079115356717]
まず,関連するイベントを検知してイベント関連クエリを拡張する手法を提案する。
クエリとイベントの両方に意味論的に関連する用語として拡張候補を導出する。
提案手法は,各種ニュースワイヤTRECデータセットの最先端手法と比較して,クエリ拡張性能を著しく向上することを示す。
論文 参考訳(メタデータ) (2020-12-22T14:56:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。