論文の概要: Generate, Filter, and Fuse: Query Expansion via Multi-Step Keyword
Generation for Zero-Shot Neural Rankers
- arxiv url: http://arxiv.org/abs/2311.09175v1
- Date: Wed, 15 Nov 2023 18:11:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 14:39:03.187904
- Title: Generate, Filter, and Fuse: Query Expansion via Multi-Step Keyword
Generation for Zero-Shot Neural Rankers
- Title(参考訳): ゼロショットニューラルランサーのためのマルチステップキーワード生成によるクエリ拡張
- Authors: Minghan Li, Honglei Zhuang, Kai Hui, Zhen Qin, Jimmy Lin, Rolf
Jagerman, Xuanhui Wang, Michael Bendersky
- Abstract要約: 本研究では,現在の文献に拡張技術を直接適用することにより,ゼロショット性能が劣化することを示す。
我々は,大規模言語モデルとニューラルローダを含むパイプラインであるGFFを提案し,より効率的にクエリ拡張を生成する。
- 参考スコア(独自算出の注目度): 75.54436030331793
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Query expansion has been proved to be effective in improving recall and
precision of first-stage retrievers, and yet its influence on a complicated,
state-of-the-art cross-encoder ranker remains under-explored. We first show
that directly applying the expansion techniques in the current literature to
state-of-the-art neural rankers can result in deteriorated zero-shot
performance. To this end, we propose GFF, a pipeline that includes a large
language model and a neural ranker, to Generate, Filter, and Fuse query
expansions more effectively in order to improve the zero-shot ranking metrics
such as nDCG@10. Specifically, GFF first calls an instruction-following
language model to generate query-related keywords through a reasoning chain.
Leveraging self-consistency and reciprocal rank weighting, GFF further filters
and combines the ranking results of each expanded query dynamically. By
utilizing this pipeline, we show that GFF can improve the zero-shot nDCG@10 on
BEIR and TREC DL 2019/2020. We also analyze different modelling choices in the
GFF pipeline and shed light on the future directions in query expansion for
zero-shot neural rankers.
- Abstract(参考訳): クエリ拡張は、第1ステージレトリバーのリコールと精度向上に効果的であることが証明されているが、複雑で最先端のクロスエンコーダランチャーへの影響は未検討のままである。
まず,現在の文献に拡張技術を直接適用することにより,ゼロショット性能が劣化することを示す。
そこで我々は,ndcg@10のようなゼロショットランキング指標を改善するために,クエリ拡張の生成,フィルタリング,ヒューズをより効果的に行うための,大規模言語モデルとニューラルネットワークランカを備えたパイプラインであるgffを提案する。
特に、GFFはまず命令追従言語モデルを呼び出し、推論チェーンを通じてクエリ関連キーワードを生成する。
自己整合性と相互ランク重み付けを活用して、GFFはさらにフィルタし、各拡張クエリのランキング結果を動的に組み合わせる。
このパイプラインを利用することで、GFFはBEIRおよびTREC DL 2019/2020におけるゼロショットnDCG@10を改善することができることを示す。
また,gffパイプラインにおける異なるモデリング選択を分析し,ゼロショットニューラルランカのクエリ拡張における今後の方向性を明らかにした。
関連論文リスト
- Distillation Enhanced Generative Retrieval [96.69326099136289]
生成的検索はテキスト検索において有望な新しいパラダイムであり、関連する通路の識別子文字列を検索対象として生成する。
本研究は, 蒸留による生成的検索をさらに促進するための有効な方向を特定し, DGR という名称の実行可能なフレームワークを提案する。
本研究では,4つの公開データセットに対して実験を行い,DGRが生成的検索手法の最先端性能を達成することを示す。
論文 参考訳(メタデータ) (2024-02-16T15:48:24Z) - GAR-meets-RAG Paradigm for Zero-Shot Information Retrieval [16.369071865207808]
本稿では,既存のパラダイムの課題を克服する新しいGAR-meets-RAG再帰の定式化を提案する。
鍵となる設計原則は、リライト・検索段階がシステムのリコールを改善し、最終段階が精度を向上させることである。
我々の手法はBEIRベンチマークで新たな最先端性を確立し、8つのデータセットのうち6つでRecall@100とnDCG@10の指標で過去の最高の結果を上回った。
論文 参考訳(メタデータ) (2023-10-31T03:52:08Z) - Enhancing Few-shot NER with Prompt Ordering based Data Augmentation [59.69108119752584]
本稿では,PODA(Prompt Ordering Based Data Augmentation)手法を提案する。
3つのパブリックNERデータセットの実験結果とさらなる分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-19T16:25:43Z) - Deep Graph Neural Networks via Flexible Subgraph Aggregation [50.034313206471694]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習し、近隣情報を集約することでノードの表現を学ぶ。
本稿では,サブグラフアグリゲーションの観点から,GNNの表現力を評価する。
サブグラフアグリゲーションの異なるホップをより柔軟に活用できるサンプリングベースノードレベル残余モジュール(SNR)を提案する。
論文 参考訳(メタデータ) (2023-05-09T12:03:42Z) - Modified Query Expansion Through Generative Adversarial Networks for
Information Extraction in E-Commerce [1.713291434132985]
本研究は,eコマースにおける情報検索の有効性を高めるために,GAN(Generative Adversarial Network)を用いたクエリ拡張のための代替手法を提案する。
そこで本研究では,クエリを合成クエリで拡張することでキーワードを解消する,改良されたQE条件付きGAN(mQE-CGAN)フレームワークを提案する。
実験により,mQE-CGANフレームワークにおける条件構造の利用により,生成したシーケンスと参照ドキュメントのセマンティックな類似性が10%近く向上することを示した。
論文 参考訳(メタデータ) (2022-12-30T19:21:44Z) - GFlowCausal: Generative Flow Networks for Causal Discovery [27.51595081346858]
本稿では,GFlowCausalと呼ばれる観測データからDAG(Directed Acyclic Graph)を学習するための新しい手法を提案する。
GFlowCausalは、事前定義された報酬に比例した確率を持つシーケンシャルアクションによって、ハイリワードDAGを生成するための最良のポリシーを学ぶことを目的としている。
合成データセットと実データセットの両方について広範な実験を行い、提案手法が優れていることを示すとともに、大規模環境での良好な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T04:07:39Z) - Nearest Neighbor Zero-Shot Inference [68.56747574377215]
kNN-Promptは、言語モデル(LM)を用いたゼロショット推論のためのk-nearest neighbor (kNN)検索拡張手法である。
ファジィ動詞化器は、各分類ラベルを自然言語トークンのセットに自動的に関連付けることで、下流タスクのスパースkNN分布を利用する。
実験により,kNN-Promptはドメイン適応に有効であり,さらに,kNN検索に使用するモデルのサイズに応じて,検索のメリットが増加することが示された。
論文 参考訳(メタデータ) (2022-05-27T07:00:59Z) - KG-FiD: Infusing Knowledge Graph in Fusion-in-Decoder for Open-Domain
Question Answering [68.00631278030627]
検索した通路間の構造的関係を知識グラフで利用することにより,ノイズのある通路をフィルタする新しい手法KG-FiDを提案する。
我々は,KG-FiDが解答一致スコアの最大1.5%向上し,計算コストの40%程度でFiDに匹敵する性能が得られることを示した。
論文 参考訳(メタデータ) (2021-10-08T18:39:59Z) - SPLADE v2: Sparse Lexical and Expansion Model for Information Retrieval [11.38022203865326]
SPLADEモデルは、最先端の高密度かつスパースなアプローチに関して、高度にスパースな表現と競争結果を提供する。
我々は、プール機構を変更し、文書拡張のみに基づいてモデルをベンチマークし、蒸留で訓練されたモデルを導入する。
全体として、SPLADEはTREC DL 2019のNDCG@10で9ドル以上のゲインで大幅に改善され、BEIRベンチマークで最先端の結果が得られた。
論文 参考訳(メタデータ) (2021-09-21T10:43:42Z) - GQE-PRF: Generative Query Expansion with Pseudo-Relevance Feedback [8.142861977776256]
PRFに基づくクエリ拡張にテキスト生成モデルを効果的に統合する新しい手法を提案する。
提案手法では,初期クエリと擬似関連フィードバックの両方を条件としたニューラルテキスト生成モデルを用いて,拡張クエリ項を生成する。
2つのベンチマークデータセットを用いて,情報検索タスクに対するアプローチの有効性を評価する。
論文 参考訳(メタデータ) (2021-08-13T01:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。