論文の概要: Decoding a Neural Retriever's Latent Space for Query Suggestion
- arxiv url: http://arxiv.org/abs/2210.12084v1
- Date: Fri, 21 Oct 2022 16:19:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 13:25:29.905432
- Title: Decoding a Neural Retriever's Latent Space for Query Suggestion
- Title(参考訳): クエリ提案のためのニューラルリトリバーの潜在空間のデコード
- Authors: Leonard Adolphs, Michelle Chen Huebscher, Christian Buck, Sertan
Girgin, Olivier Bachem, Massimiliano Ciaramita, Thomas Hofmann
- Abstract要約: 本稿では,有意なクエリをその潜在表現から復号することが可能であること,また,潜在空間の正しい方向に移動すると,関連する段落を検索するクエリを復号することができることを示す。
クエリデコーダを用いて、MSMarcoのクエリ再構成の大規模な合成データセットを生成する。
このデータに基づいて、クエリー提案の適用のために擬似関連フィードバック(PRF)T5モデルを訓練する。
- 参考スコア(独自算出の注目度): 28.410064376447718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural retrieval models have superseded classic bag-of-words methods such as
BM25 as the retrieval framework of choice. However, neural systems lack the
interpretability of bag-of-words models; it is not trivial to connect a query
change to a change in the latent space that ultimately determines the retrieval
results. To shed light on this embedding space, we learn a "query decoder"
that, given a latent representation of a neural search engine, generates the
corresponding query. We show that it is possible to decode a meaningful query
from its latent representation and, when moving in the right direction in
latent space, to decode a query that retrieves the relevant paragraph. In
particular, the query decoder can be useful to understand "what should have
been asked" to retrieve a particular paragraph from the collection. We employ
the query decoder to generate a large synthetic dataset of query reformulations
for MSMarco, leading to improved retrieval performance. On this data, we train
a pseudo-relevance feedback (PRF) T5 model for the application of query
suggestion that outperforms both query reformulation and PRF information
retrieval baselines.
- Abstract(参考訳): ニューラル検索モデルは、bm25のような古典的な単語のバッグ・オブ・ワード法を検索フレームワークとして置き換えた。
しかし、ニューラルネットワークは、単語の袋モデルの解釈性に欠けており、クエリの変更を最終的に検索結果を決定する潜在空間の変更につなぐことは自明ではない。
この埋め込み空間に光を当てるために、ニューラルネットワークの潜在表現が与えられた場合、対応するクエリを生成する"クエリデコーダ"を学習する。
我々は,その潜在表現から有意義なクエリをデコードすることができ,また,潜在空間で正しい方向に移動する場合,関連する段落を取得するクエリをデコードできることを示す。
特に、クエリデコーダは、コレクションから特定の段落を取得するために「何を要求すべきか」を理解するのに役立ちます。
我々はクエリデコーダを用いてmsmarcoのクエリ変換の大規模な合成データセットを生成し,検索性能の向上に繋がる。
このデータに基づいて、クエリ修正とPRF情報検索ベースラインの両方に優れるクエリ提案の適用のために、擬似関連フィードバック(PRF)T5モデルを訓練する。
関連論文リスト
- Aligning Query Representation with Rewritten Query and Relevance Judgments in Conversational Search [32.35446999027349]
我々は、より優れたクエリ表現モデルをトレーニングするために、リライトされたクエリと会話検索データの関連判断の両方を活用する。
提案したモデル --Query Representation Alignment Conversational Retriever(QRACDR)は、8つのデータセットでテストされる。
論文 参考訳(メタデータ) (2024-07-29T17:14:36Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Adaptive Query Rewriting: Aligning Rewriters through Marginal Probability of Conversational Answers [66.55612528039894]
AdaQRは、シードデータセットからの限定的な書き直しアノテーションと完全にパスラベルのないクエリ書き換えモデルをトレーニングするフレームワークである。
会話クエリに条件付き回答の確率を用いて,これらの候補に対する検索者の嗜好を評価する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T16:09:05Z) - User Intent Recognition and Semantic Cache Optimization-Based Query Processing Framework using CFLIS and MGR-LAU [0.0]
この研究は、拡張QPのためのクエリにおける情報、ナビゲーション、およびトランザクションベースのインテントを分析した。
効率的なQPのために、データはEpanechnikov Kernel-Ordering Pointsを用いて構造化され、クラスタリング構造(EK-OPTICS)を同定する。
抽出された特徴、検出された意図、構造化データは、MGR-LAU(Multi-head Gated Recurrent Learnable Attention Unit)に入力される。
論文 参考訳(メタデータ) (2024-06-06T20:28:05Z) - Selecting Query-bag as Pseudo Relevance Feedback for Information-seeking Conversations [76.70349332096693]
情報検索対話システムは電子商取引システムで広く利用されている。
クエリバッグに基づくPseudo Relevance Feedback framework(QB-PRF)を提案する。
関連クエリを備えたクエリバッグを構築し、擬似シグナルとして機能し、情報検索の会話をガイドする。
論文 参考訳(メタデータ) (2024-03-22T08:10:32Z) - Ask Optimal Questions: Aligning Large Language Models with Retriever's
Preference in Conversational Search [25.16282868262589]
RetPOは、ターゲット検索システムの好みに合わせて検索クエリを再構成するための言語モデル(LM)を最適化するように設計されている。
我々は、12Kの会話で410K以上のクエリを書き換えるRetrievers' Feedbackと呼ばれる大規模なデータセットを構築した。
このモデルにより,最近の2つの対話型検索ベンチマークにおいて,最先端の性能が得られた。
論文 参考訳(メタデータ) (2024-02-19T04:41:31Z) - ConvGQR: Generative Query Reformulation for Conversational Search [37.54018632257896]
ConvGQRは、生成事前訓練された言語モデルに基づいて会話クエリを再構成する新しいフレームワークである。
本稿では,クエリ再構成と検索の両方を最適化する知識注入機構を提案する。
論文 参考訳(メタデータ) (2023-05-25T01:45:06Z) - Decomposing Complex Queries for Tip-of-the-tongue Retrieval [72.07449449115167]
複雑なクエリは、コンテンツ要素(例えば、書籍の文字やイベント)、ドキュメントテキスト以外の情報を記述する。
この検索設定は舌の先端 (TOT) と呼ばれ、クエリと文書テキスト間の語彙的および意味的重複に依存するモデルでは特に困難である。
クエリを個別のヒントに分解し、サブクエリとしてルーティングし、特定の検索者にルーティングし、結果をアンサンブルすることで、このような複雑なクエリを扱うための、シンプルで効果的なフレームワークを導入します。
論文 参考訳(メタデータ) (2023-05-24T11:43:40Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。