論文の概要: Event-enhanced Retrieval in Real-time Search
- arxiv url: http://arxiv.org/abs/2404.05989v1
- Date: Tue, 9 Apr 2024 03:47:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 15:58:48.298816
- Title: Event-enhanced Retrieval in Real-time Search
- Title(参考訳): リアルタイム検索におけるイベント強調検索
- Authors: Yanan Zhang, Xiaoling Bai, Tianhua Zhou,
- Abstract要約: 既存の埋め込みベースの検索モデルは、しばしば「セマンティックドリフト」問題に直面し、キー情報に重点を置いていない。
本稿では,デュアルエンコーダモデルの改良により,リアルタイム検索性能を向上させるEERという新しい手法を提案する。
我々は,この手法が情報検索の分野で新たな視点をもたらすと信じている。
- 参考スコア(独自算出の注目度): 5.720930457681116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The embedding-based retrieval (EBR) approach is widely used in mainstream search engine retrieval systems and is crucial in recent retrieval-augmented methods for eliminating LLM illusions. However, existing EBR models often face the "semantic drift" problem and insufficient focus on key information, leading to a low adoption rate of retrieval results in subsequent steps. This issue is especially noticeable in real-time search scenarios, where the various expressions of popular events on the Internet make real-time retrieval heavily reliant on crucial event information. To tackle this problem, this paper proposes a novel approach called EER, which enhances real-time retrieval performance by improving the dual-encoder model of traditional EBR. We incorporate contrastive learning to accompany pairwise learning for encoder optimization. Furthermore, to strengthen the focus on critical event information in events, we include a decoder module after the document encoder, introduce a generative event triplet extraction scheme based on prompt-tuning, and correlate the events with query encoder optimization through comparative learning. This decoder module can be removed during inference. Extensive experiments demonstrate that EER can significantly improve the real-time search retrieval performance. We believe that this approach will provide new perspectives in the field of information retrieval. The codes and dataset are available at https://github.com/open-event-hub/Event-enhanced_Retrieval .
- Abstract(参考訳): 埋め込み型検索 (EBR) 手法は, 主流検索エンジン検索システムにおいて広く採用されており, LLMイリュージョンを除去するための最近の検索拡張手法において重要である。
しかし、既存のERRモデルは、しばしば「セマンティックドリフト」の問題に直面し、キー情報に焦点を合わせていないため、後続のステップでの検索結果の採用率が低くなる。
この問題は、インターネット上の人気イベントの様々な表現が、重要なイベント情報に頼ってリアルタイム検索を行うリアルタイム検索のシナリオにおいて特に顕著である。
そこで本研究では,従来のERRのデュアルエンコーダモデルの改良により,リアルタイム検索性能を向上させるEERという手法を提案する。
コントラスト学習とペア学習を併用してエンコーダ最適化を行う。
さらに、イベントにおける重要なイベント情報へのフォーカスを強化するため、文書エンコーダの後にデコーダモジュールを含め、プロンプトチューニングに基づく生成イベントトリプルト抽出方式を導入し、比較学習を通じてクエリエンコーダ最適化と相関する。
このデコーダモジュールは推論中に削除できる。
大規模な実験により、EERはリアルタイム検索性能を大幅に改善できることが示された。
我々は,この手法が情報検索の分野で新たな視点をもたらすと信じている。
コードとデータセットはhttps://github.com/open-event-hub/Event-enhanced_Retrieval で公開されている。
関連論文リスト
- Improving Retrieval in Sponsored Search by Leveraging Query Context Signals [6.152499434499752]
本稿では,クエリをリッチなコンテキスト信号で拡張することで,クエリ理解を強化する手法を提案する。
我々は、Web検索のタイトルとスニペットを使って、現実世界の情報にクエリを接地し、GPT-4を使ってクエリの書き直しと説明を生成する。
我々の文脈認識アプローチは文脈自由モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2024-07-19T14:28:53Z) - Event-driven Real-time Retrieval in Web Search [15.235255100530496]
本稿では,リアルタイム検索の意図を表すイベント情報を用いてクエリを拡張する。
マルチタスクトレーニングにより、イベント表現のためのモデルの能力をさらに強化する。
提案手法は既存の最先端のベースライン法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-12-01T06:30:31Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Zero-shot Audio Topic Reranking using Large Language Models [42.774019015099704]
実例によるマルチモーダルビデオ検索 (MVSE) では, ビデオクリップを情報検索の問合せ語として利用する。
本研究の目的は,この高速アーカイブ検索による性能損失を,再ランク付け手法を検証することによって補償することである。
パブリックなビデオアーカイブであるBBC Rewind corpusでトピックベースの検索のパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-09-14T11:13:36Z) - Event-Centric Query Expansion in Web Search [12.341071896152174]
イベント中心クエリ拡張(英: Event-Centric Query Expansion, EQE)は、大量の潜在的なイベントを迅速かつ正確に抽出する新しいQEシステムである。
このシステムはTencent QQ Browser Searchにデプロイされ、数億人のユーザーに提供された。
論文 参考訳(メタデータ) (2023-05-30T13:19:53Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z) - Noise-Robust Dense Retrieval via Contrastive Alignment Post Training [89.29256833403167]
Contrastive Alignment POst Training (CAPOT) は、指数再生を必要とせず、モデルロバスト性を改善する高効率な微調整法である。
CAPOTはドキュメントエンコーダを凍結することで堅牢な検索を可能にし、クエリエンコーダはノイズの多いクエリを修正されていないルートに整列させる。
MSMARCO、Natural Questions、Trivia QAパス検索のCAPOTノイズ変動を評価し、CAPOTがオーバーヘッドを伴わないデータ増大に類似した影響があることを発見した。
論文 参考訳(メタデータ) (2023-04-06T22:16:53Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - AntPivot: Livestream Highlight Detection via Hierarchical Attention
Mechanism [64.70568612993416]
本稿では,Livestream Highlight Detectionという新たなタスクを定式化し,上記の課題を議論・分析し,新しいアーキテクチャAntPivotを提案する。
我々は、このタスクをインスタンス化し、我々のモデルの性能を評価するために、完全に注釈付きデータセットAntHighlightを構築した。
論文 参考訳(メタデータ) (2022-06-10T05:58:11Z) - Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。
また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。
提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文 参考訳(メタデータ) (2020-05-18T11:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。