論文の概要: Expand, Rerank, and Retrieve: Query Reranking for Open-Domain Question
Answering
- arxiv url: http://arxiv.org/abs/2305.17080v1
- Date: Fri, 26 May 2023 16:41:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 13:27:24.741251
- Title: Expand, Rerank, and Retrieve: Query Reranking for Open-Domain Question
Answering
- Title(参考訳): Expand, Rerank, Retrieve: オープンドメイン質問回答のためのクエリリランク
- Authors: Yung-Sung Chuang, Wei Fang, Shang-Wen Li, Wen-tau Yih, James Glass
- Abstract要約: EARはまず、クエリ拡張モデルを適用して、さまざまなクエリセットを生成した後、クエリリランカを使用して、より優れた検索結果につながるクエリを選択する。
クエリ拡張モデルとレトリバーの接続により、EARは従来のスパース検索手法BM25を大幅に強化する。
- 参考スコア(独自算出の注目度): 28.05138829730091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose EAR, a query Expansion And Reranking approach for improving
passage retrieval, with the application to open-domain question answering. EAR
first applies a query expansion model to generate a diverse set of queries, and
then uses a query reranker to select the ones that could lead to better
retrieval results. Motivated by the observation that the best query expansion
often is not picked by greedy decoding, EAR trains its reranker to predict the
rank orders of the gold passages when issuing the expanded queries to a given
retriever. By connecting better the query expansion model and retriever, EAR
significantly enhances a traditional sparse retrieval method, BM25.
Empirically, EAR improves top-5/20 accuracy by 3-8 and 5-10 points in in-domain
and out-of-domain settings, respectively, when compared to a vanilla query
expansion model, GAR, and a dense retrieval model, DPR.
- Abstract(参考訳): 提案手法は,問合せ検索の改善のためのクエリ拡張と再格付け手法であるEARであり,オープンドメイン質問応答への応用である。
EARはまず、クエリ拡張モデルを適用して、さまざまなクエリセットを生成した後、クエリリランカを使用して、より良い検索結果につながるクエリを選択する。
EARは、最良のクエリ拡張がgreedy復号化によって選択されないという観察に感銘を受け、拡張クエリを所定のレトリバーに発行する際、そのリランカを訓練して、金の通路のランク順序を予測する。
クエリ拡張モデルとレトリバーの接続により、EARは従来のスパース検索手法BM25を大幅に強化する。
EARは、バニラクエリ拡張モデルであるGARと高密度検索モデルであるDPRと比較して、ドメイン内設定で3~8ポイント、ドメイン外設定で5~10ポイント、それぞれトップ5/20精度を改善する。
関連論文リスト
- Ask Optimal Questions: Aligning Large Language Models with Retriever's
Preference in Conversational Search [25.16282868262589]
RetPOは、ターゲット検索システムの好みに合わせて検索クエリを再構成するための言語モデル(LM)を最適化するように設計されている。
我々は、12Kの会話で410K以上のクエリを書き換えるRetrievers' Feedbackと呼ばれる大規模なデータセットを構築した。
このモデルにより,最近の2つの対話型検索ベンチマークにおいて,最先端の性能が得られた。
論文 参考訳(メタデータ) (2024-02-19T04:41:31Z) - Can Query Expansion Improve Generalization of Strong Cross-Encoder Rankers? [72.42500059688396]
本稿では,拡張されたクエリのランク付け結果を融合により高速化し,エンジニアリングの迅速化と集約を行うことにより,強力なニューラルネットワークローカの一般化を向上できることを示す。
BEIR と TREC Deep Learning の実験では,MonoT5 と RankT5 の nDCG@10 スコアがこれらのステップに従って改善された。
論文 参考訳(メタデータ) (2023-11-15T18:11:41Z) - When do Generative Query and Document Expansions Fail? A Comprehensive
Study Across Methods, Retrievers, and Datasets [69.28733312110566]
LMに基づく拡張の最初の包括的解析を行う。
抽出器の性能と拡張による利得との間には強い負の相関関係があることが判明した。
より弱いモデルに拡張を使用するか、ターゲットデータセットがフォーマットのトレーニングコーパスと大きく異なる場合。
論文 参考訳(メタデータ) (2023-09-15T17:05:43Z) - Inference-time Re-ranker Relevance Feedback for Neural Information
Retrieval [84.20748790986131]
検索と参照のフレームワークは、まずK(例えば100)候補を検索し、次により強力なクロスエンコーダモデルを使って上位の候補をランク付けする。
リランカは一般的に、レトリバーよりも優れた候補スコアを生成するが、トップKのみの検索に限られる。
本研究では、リランカを活用して、推論時間関連性フィードバックを検索者に提供することにより、検索を改善する。
論文 参考訳(メタデータ) (2023-05-19T15:30:33Z) - Decoding a Neural Retriever's Latent Space for Query Suggestion [28.410064376447718]
本稿では,有意なクエリをその潜在表現から復号することが可能であること,また,潜在空間の正しい方向に移動すると,関連する段落を検索するクエリを復号することができることを示す。
クエリデコーダを用いて、MSMarcoのクエリ再構成の大規模な合成データセットを生成する。
このデータに基づいて、クエリー提案の適用のために擬似関連フィードバック(PRF)T5モデルを訓練する。
論文 参考訳(メタデータ) (2022-10-21T16:19:31Z) - Query Expansion and Entity Weighting for Query Reformulation Retrieval
in Voice Assistant Systems [6.590172620606211]
Alexa、Siri、Google Assistantといった音声アシスタントは世界中で人気が高まっている。
言語的変化, 音声パターンの変動, 環境音響条件, その他の要因は, ユーザのクエリを誤解釈するアシスタントと相関することが多い。
Retrieval based query reformulation (QR) システムは、これらの誤解釈されたユーザクエリを再構成するために広く利用されている。
論文 参考訳(メタデータ) (2022-02-22T23:03:29Z) - Learning Query Expansion over the Nearest Neighbor Graph [94.80212602202518]
グラフクエリ拡張(GQE)が提示され、教師付き方法で学習され、クエリの拡張近傍で集約を実行する。
この技術は既知のベンチマークよりも最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-12-05T19:48:42Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。