Fugu-MT 論文翻訳(概要): BERT-QE: Contextualized Query Expansion for Document Re-ranking

論文の概要: BERT-QE: Contextualized Query Expansion for Document Re-ranking

arxiv url: http://arxiv.org/abs/2009.07258v2
Date: Tue, 3 Nov 2020 16:08:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-18 06:34:27.243896
Title: BERT-QE: Contextualized Query Expansion for Document Re-ranking
Title（参考訳）: BERT-QE: ドキュメントの再ランク付けのためのコンテキスト化クエリ拡張
Authors: Zhi Zheng, Kai Hui, Ben He, Xianpei Han, Le Sun, Andrew Yates
Abstract要約: 本稿では,BERTモデルの強みを生かした新しいクエリ拡張モデルを提案する。標準のTREC Robust04およびGOV2テストコレクションの評価において,提案したBERT-QEモデルはBERT-Largeモデルよりも有意に優れていた。
参考スコア（独自算出の注目度）: 38.178360442306094
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Query expansion aims to mitigate the mismatch between the language used in a query and in a document. However, query expansion methods can suffer from introducing non-relevant information when expanding the query. To bridge this gap, inspired by recent advances in applying contextualized models like BERT to the document retrieval task, this paper proposes a novel query expansion model that leverages the strength of the BERT model to select relevant document chunks for expansion. In evaluation on the standard TREC Robust04 and GOV2 test collections, the proposed BERT-QE model significantly outperforms BERT-Large models.
Abstract（参考訳）: クエリ拡張は、クエリとドキュメントで使用される言語間のミスマッチを軽減することを目的としている。しかし,クエリ拡張手法では,クエリ拡張時に非関連情報の導入に悩まされることがある。文書検索タスクにbertのようなコンテキスト化モデルを適用する最近の進歩に触発されたこのギャップを埋めるため,本稿では,bertモデルの強みを利用して拡張のための関連する文書チャンクを選択する新しいクエリ拡張モデルを提案する。標準のTREC Robust04およびGOV2テストコレクションの評価において,提案したBERT-QEモデルはBERT-Largeモデルよりも有意に優れていた。

関連論文リスト

SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension [77.93156509994994]
本研究では,検索性能を向上させるために,より広いコンテキストウインドウに条件付きで短いチャンクを表現する方法を示す。既存の埋め込みモデルは、そのような場所のコンテキストを効果的にエンコードするのに十分な装備がない。我々の手法は、最先端の埋め込みモデルよりも大幅に優れている。
論文参考訳（メタデータ） (2025-08-03T23:59:31Z)
QA-Expand: Multi-Question Answer Generation for Enhanced Query Expansion in Information Retrieval [12.095687580827065]
本稿では,クエリ拡張のための新しい効果的なフレームワークであるQA-Expandを紹介する。まず、最初のクエリから複数の関連する質問を生成し、その後、サロゲート文書として対応する疑似回答を生成する。 BEIR(英語版)やTREC(英語版)などのベンチマークの大規模な実験は、QA-Expandが最先端の手法よりも最大13%検索性能を向上させることを示した。
論文参考訳（メタデータ） (2025-02-12T16:39:06Z)
Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.42043077545341]
知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文参考訳（メタデータ） (2024-10-17T17:03:23Z)
Improving Topic Relevance Model by Mix-structured Summarization and LLM-based Data Augmentation [16.170841777591345]
Dianpingのようなほとんどのソーシャル検索シナリオでは、検索関連性のモデリングは常に2つの課題に直面している。まず、クエリベースの要約と、クエリなしで文書の要約をトピック関連モデルの入力として取り上げる。そこで我々は,大規模言語モデル(LLM)の言語理解と生成能力を利用して,既存のトレーニングデータにおけるクエリやドキュメントからのクエリを書き換え,生成する。
論文参考訳（メタデータ） (2024-04-03T10:05:47Z)
MILL: Mutual Verification with Large Language Models for Zero-Shot Query Expansion [39.24969189479343]
本稿では,大規模言語モデル(LLM)を相互検証に用いるゼロショットクエリ拡張フレームワークを提案する。提案手法は完全にゼロショットであり,その有効性を示すために3つの公開ベンチマークデータセットに関する広範な実験を行った。
論文参考訳（メタデータ） (2023-10-29T16:04:10Z)
Query2doc: Query Expansion with Large Language Models [69.9707552694766]
提案手法はまず,大言語モデル (LLM) をプロンプトすることで擬似文書を生成する。 query2docは、アドホックIRデータセットでBM25のパフォーマンスを3%から15%向上させる。また,本手法は,ドメイン内およびドメイン外の両方において,最先端の高密度検索に有効である。
論文参考訳（メタデータ） (2023-03-14T07:27:30Z)
CAPSTONE: Curriculum Sampling for Dense Retrieval with Document Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文参考訳（メタデータ） (2022-12-18T15:57:46Z)
Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文参考訳（メタデータ） (2022-10-13T15:18:04Z)
Generate rather than Retrieve: Large Language Models are Strong Context Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文参考訳（メタデータ） (2022-09-21T01:30:59Z)
Query-Based Keyphrase Extraction from Long Documents [4.823229052465654]
本稿では,長文をチャンクすることでキーフレーズ抽出の問題を克服する。システムは、事前訓練されたBERTモデルを採用し、それを適応して、与えられたテキストがキーフレーズを形成する確率を推定する。
論文参考訳（メタデータ） (2022-05-11T10:29:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。