論文の概要: Query Understanding via Intent Description Generation
- arxiv url: http://arxiv.org/abs/2008.10889v1
- Date: Tue, 25 Aug 2020 08:56:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 03:42:39.262822
- Title: Query Understanding via Intent Description Generation
- Title(参考訳): インテント記述生成によるクエリ理解
- Authors: Ruqing Zhang, Jiafeng Guo, Yixing Fan, Yanyan Lan, and Xueqi Cheng
- Abstract要約: 問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
- 参考スコア(独自算出の注目度): 75.64800976586771
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query understanding is a fundamental problem in information retrieval (IR),
which has attracted continuous attention through the past decades. Many
different tasks have been proposed for understanding users' search queries,
e.g., query classification or query clustering. However, it is not that precise
to understand a search query at the intent class/cluster level due to the loss
of many detailed information. As we may find in many benchmark datasets, e.g.,
TREC and SemEval, queries are often associated with a detailed description
provided by human annotators which clearly describes its intent to help
evaluate the relevance of the documents. If a system could automatically
generate a detailed and precise intent description for a search query, like
human annotators, that would indicate much better query understanding has been
achieved. In this paper, therefore, we propose a novel
Query-to-Intent-Description (Q2ID) task for query understanding. Unlike those
existing ranking tasks which leverage the query and its description to compute
the relevance of documents, Q2ID is a reverse task which aims to generate a
natural language intent description based on both relevant and irrelevant
documents of a given query. To address this new task, we propose a novel
Contrastive Generation model, namely CtrsGen for short, to generate the intent
description by contrasting the relevant documents with the irrelevant documents
given a query. We demonstrate the effectiveness of our model by comparing with
several state-of-the-art generation models on the Q2ID task. We discuss the
potential usage of such Q2ID technique through an example application.
- Abstract(参考訳): 問合せ理解は情報検索(IR)における根本的な問題であり、過去数十年にわたって継続的な注目を集めてきた。
クエリ分類やクエリクラスタリングなど,ユーザの検索クエリを理解するために,さまざまなタスクが提案されている。
しかし、多くの詳細な情報が失われているため、意図クラス/クラスタレベルでの検索クエリを理解することはそれほど正確ではない。
TRECやSemEvalといった多くのベンチマークデータセットに見られるように、クエリは、ドキュメントの関連性を評価するための意図を明確に記述する人間のアノテーションによって提供される詳細な記述と関連付けられていることが多い。
もしシステムが人間のアノテータのような検索クエリの詳細なインテント記述を自動的に生成できれば、より優れたクエリ理解が達成されたことを示すだろう。
そこで本稿では,クエリ理解のための新しいQ2IDタスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは、あるクエリの関連性および非関連性の両方に基づいて自然言語のインテント記述を生成することを目的とした逆タスクである。
そこで本稿では,この課題に対処するために,クエリが与えられた文書と無関係な文書を対比してインテント記述を生成するための新しいコントラスト生成モデルctrsgenを提案する。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を示す。
本稿では、実例によるQ2ID手法の可能性について論じる。
関連論文リスト
- MILL: Mutual Verification with Large Language Models for Zero-Shot Query
Expansion [41.21789597997263]
本稿では,クエリ拡張のための新たなLarge Language Model (LLM) に基づく相互検証フレームワークを提案する。
具体的には、まず、LLMに符号化された文脈知識を効果的に活用できるクエリクエリー文書生成パイプラインを設計する。
次に、生成した文書と検索した文書の相互検証手法を用いて、検索した文書を、生成した文書の外部コンテキスト知識でフィルタリングし、生成した文書を、検索した文書のコーパス固有の知識でフィルタリングする。
論文 参考訳(メタデータ) (2023-10-29T16:04:10Z) - Automated Query Generation for Evidence Collection from Web Search
Engines [2.642698101441705]
インターネット上で情報を探すことで、いわゆる事実を確認できることが広く受け入れられている。
このプロセスでは、事実に基づいて検索クエリを定式化し、それを検索エンジンに提示するためにファクトチェッカーが必要である。
まず,第1ステップ,問合せ生成の自動化が可能かどうかを問う。
論文 参考訳(メタデータ) (2023-03-15T14:32:00Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。